詞條
詞條說明
漢語分詞(Chinese Word Segmentation) 指的是將一個漢字序列切分成一個一個單獨的詞。分詞就是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。中文分詞是其他中文信息處理的基礎,搜索引擎只是中文分詞的一個應用。其他的比如機器翻譯(MT)、語音合成、自動分類、自動摘要、自動校對等等,都需要用到分詞。 漢語自動分詞是目前中文信息處理領域公認的一大難題,也是自然語言理解研究領域
自然語言理解是語言學、邏輯學、生理學、心理學、計算機科學和數學等相關學科發(fā)展和結合而形成的一門交叉學科;它能夠理解口頭語言或書面語言。 自然語言處理是計算機科學領域與人工智能領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通信的各種理論和方法。NLU是自然語言理解(Natural Language Understanding)的縮寫。 隨著計算機技術和人工智能總體技術的發(fā)展,自然
全文索引用于處理大文本集合,利用它人們可以在海量文本中快速獲取需要的信息。全文檢索系統(tǒng)是按照全文檢索理論建立起來的用于提供全文檢索服務的軟件系統(tǒng)。一般來說,全文檢索需要具備建立索引和提供查詢的基本功能,此外現代的全文檢索系統(tǒng)還需要具有方便的用戶接口、面向WWW的開發(fā)接口、二次應用開發(fā)接口等等。功能上,全文檢索系統(tǒng)**具有建立索引、處理查詢返回結果集、增加索引、優(yōu)化索引結構等等功能,外圍則由各種不
隨著互聯網的飛速發(fā)展,網絡已經成為人們日常獲取信息和知識的重要媒介?;ヂ摼W包含了龐大的信息量,具有開放性、動態(tài)性、匿名信、互動性等特點,它不僅給人們帶來了豐富的信息,也成為人們自由交互信息的平臺。與此同時,互聯網固有的分散性等特點也給網絡資源統(tǒng)一管理造成了困難。許多敏感的、不健康的、甚至是惡意的信息摻雜其中。對社會穩(wěn)定和人們身心健康造成了較大的危害,特別是影響青少年的健康成長。為此,我國乃至世界
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
電 話: 010-62648216
手 機: 13681251543
微 信: 13681251543
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編:
公司名: 靈玖中科軟件(北京)有限公司
聯系人: 張寶
手 機: 13681251543
電 話: 010-62648216
地 址: 北京海淀北京市海淀區(qū)蘇州街49-3號盈智大廈5層
郵 編: