本篇內(nèi)容介紹了“HanLP分詞器的用法”的有關(guān)知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!
前言:分析關(guān)鍵詞
如何在一段文本之中提取出相應的關(guān)鍵詞呢?
之前我有想過用機器學習的方法來進行詞法分析,但是在項目中測試時正確率不夠。于是這時候便有了 HanLP-漢語言處理包 來進行提取關(guān)鍵詞的想法。
下載:.jar .properties data等文件
這里提供官網(wǎng)下載地址 HanLP下載,1.3.3數(shù)據(jù)包下載
在intellij中配置環(huán)境,并運行第一個demo
在項目中配置jar包,添加依賴。
file->Project Structure->Modules->Dependencies->+Jars
將properties文件轉(zhuǎn)移到src根目錄下,修改root為自己的數(shù)據(jù)集路徑
字符類型對應表加載失?。篋:/BaiduYunDownload/data-for-1.3.3/data/dictionary/other/CharType.dat.yes
解決辦法:查看錯誤提示頁面下是否有該文件,如果沒有則去網(wǎng)上下載一個。像我這里,由于只是使用其一部分功能,為了方便就不再下載了,這里我直接修改了一個文件的文件名—–成功運行!。
成功運行
---------------------
“HanLP分詞器的用法”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)-成都網(wǎng)站建設(shè)公司網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!
分享名稱:HanLP分詞器的用法-創(chuàng)新互聯(lián)
文章路徑:http://sd-ha.com/article36/jjppg.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供自適應網(wǎng)站、網(wǎng)站建設(shè)、微信公眾號、網(wǎng)站設(shè)計、搜索引擎優(yōu)化、企業(yè)網(wǎng)站制作
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容