隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)已經(jīng)成為人們?nèi)粘+@取信息和知識的重要媒介。互聯(lián)網(wǎng)包含了龐大的信息量,具有開放性、動態(tài)性、匿名信、互動性等特點,它不僅給人們帶來了豐富的信息,也成為人們自由交互信息的平臺。與此同時,互聯(lián)網(wǎng)固有的分散性等特點也給網(wǎng)絡(luò)資源統(tǒng)一管理造成了困難。許多敏感的、不健康的、甚至是惡意的信息摻雜其中。對社會穩(wěn)定和人們身心健康造成了較大的危害,特別是影響青少年的健康成長。為此,我國乃至世界各地都對打擊網(wǎng)絡(luò)敏感信息十分重視,制定了一些法律法規(guī),也開展了一些專項整治活動。如何能夠借助計算機分析技術(shù)手段,自動的識別和過濾網(wǎng)絡(luò)上的敏感信息,已經(jīng)成為凈化網(wǎng)絡(luò)、促進網(wǎng)絡(luò)健康發(fā)展的一項重要研究課題。 網(wǎng)絡(luò)中網(wǎng)頁的形式及內(nèi)容多種多樣,并且隨著多媒體技術(shù)的不斷發(fā)展,網(wǎng)頁的媒體類型也越累越多樣,現(xiàn)在的基于單一媒體的敏感網(wǎng)頁識別技術(shù)難以滿足網(wǎng)絡(luò)實際發(fā)展的需要。由于網(wǎng)頁內(nèi)容主要包括文本、圖像和視頻三種媒體格式,而敏感關(guān)鍵詞掃描對文本文檔篩選、過濾、分析、挖掘起到非常重要的作用。 靈玖LJKeyScanner組件是靈玖軟件多位*經(jīng)過不斷研發(fā)和實驗,針對敏感關(guān)鍵詞搜索業(yè)務(wù)需求而打造的一套組件系統(tǒng),具有專業(yè)精準(zhǔn)、高擴展性和高通用性的特點??芍С治淖帧?shù)字、特殊符號、繁體字等各種文本關(guān)鍵詞的敏感掃描,支持各類數(shù)據(jù)庫實時搜索服務(wù),并支持多語言。 靈玖LJKeyScanner組件是基于文本內(nèi)容分析的識別技術(shù),它通過運用自然語言處理、人工智能理論和大數(shù)據(jù)挖掘等各種方法和技術(shù),根據(jù)內(nèi)容的上下文語境等文本要素,分析和理解文本內(nèi)容的語義,從而發(fā)現(xiàn)目標(biāo)信息的識別技術(shù)。 網(wǎng)頁文本信息增加了網(wǎng)頁的結(jié)構(gòu)信息,因此比純文本信息復(fù)雜很多,但是文本信息識別過濾的很多技術(shù)都能用于網(wǎng)頁信息識別過濾方面。文本過濾的任務(wù)定義一直在不斷的演化,難度越來越大但也越來越接近于真實環(huán)境。 LJKeyScanner組件分析方法有點在于: 1、識別成本低,能夠較深入動態(tài)地根據(jù)用戶的需要對網(wǎng)頁進行識別和過濾; 2、具有一定的處理多語種信息的能力,覆蓋面可遍及網(wǎng)絡(luò)上所有的文本信息。
詞條
詞條說明
九眼智能:網(wǎng)絡(luò)環(huán)境需要我們堅守
網(wǎng)絡(luò)已經(jīng)全面融入經(jīng)濟社會發(fā)展的各個領(lǐng)域,成為人們學(xué)習(xí)、工作、生活的新空間。數(shù)據(jù)顯示,中國網(wǎng)民規(guī)模已達7.31億,其中手機網(wǎng)民6.95億,增長率連續(xù)三年**過10%。和人們的現(xiàn)實生活環(huán)境一樣,網(wǎng)絡(luò)空間同樣需要天朗氣清、生態(tài)良好。維護網(wǎng)絡(luò)安全,需要構(gòu)建網(wǎng)絡(luò)規(guī)則。 近年來,多部涉及互聯(lián)網(wǎng)的法律法規(guī)密集出臺,相關(guān)部門對網(wǎng)絡(luò)空間的治理不斷走向縱深,在不少市民看來,網(wǎng)絡(luò)空間建法立制才能筑牢安全基石。 “互聯(lián)網(wǎng)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和普及,人們可以在網(wǎng)絡(luò)上獲得各種信息,怎樣防止青少年接觸到不健康內(nèi)容是一個嚴(yán)肅的社會問題。要防止不健康、無用內(nèi)容的蔓延,除了從法律角度采取措施外,從技術(shù)角度考慮的網(wǎng)絡(luò)過濾技術(shù)是一種有效的手段。 目前網(wǎng)絡(luò)的信息過濾技術(shù)主要有三種,它們是基于URL過濾方式、基于文本的過濾方式和基于圖像內(nèi)容的過濾方式。這幾種過濾技術(shù)各有優(yōu)劣,有的實現(xiàn)比較簡單,有的具有較廣泛的適應(yīng)性,有的效率高
大數(shù)據(jù)LJParser文本語義分析系統(tǒng)
隨著計算機技術(shù)和網(wǎng)絡(luò)技術(shù)的*發(fā)展,互聯(lián)網(wǎng)上共享的文本呈海量趨勢增長,包括各種環(huán)境下的大文本和社交媒體文本等。如何有效存儲、管理、檢索和使用這些文本數(shù)據(jù),是擺在人們面前巨大的挑戰(zhàn)和亟待解決的研究問題。文本語義分析與挖掘是解決上述問題的基礎(chǔ)。 互聯(lián)網(wǎng)大環(huán)境下的共享文本具備特殊的屬性:1)半結(jié)構(gòu)化;2)多尺度;3)海量;4)復(fù)雜關(guān)聯(lián);5)多樣化。LJParser文本語義分析系統(tǒng)結(jié)合人工智能、統(tǒng)計分析
靈玖軟件:NLPIR機器學(xué)習(xí)技術(shù)深度理解語義信息
自然語言處理技術(shù)主要是讓機器理解人類的語言的一門領(lǐng)域。在自然語言處理技術(shù)中,大量使用了編譯原理相關(guān)的技術(shù),例如詞法分析,語法分析等等,除此之外,在理解這個層面,則使用了語義理解,機器學(xué)習(xí)等技術(shù)。作為一由人類自身創(chuàng)造的符號,自然語言處理一直是機器學(xué)習(xí)界不斷研究的方向。 大數(shù)據(jù)的**是利用數(shù)據(jù)的**,機器學(xué)習(xí)是利用數(shù)據(jù)**的關(guān)鍵技術(shù),對于大數(shù)據(jù)而言,機器學(xué)習(xí)是不可或缺的。相反,對于機器學(xué)習(xí)而言,越
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com
公司名: 靈玖中科軟件(北京)有限公司
聯(lián)系人: 張寶
手 機: 13681251543
電 話: 010-62648216
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編:
網(wǎng) 址: ljrj123.cn.b2b168.com