Spring框架中调用HanLP分词的方法

  • 时间:
  • 浏览:0
  • 来源:5分11选5APP下载_5分11选5APP官方

整好了那末 把data文件夹和hanlp.properties贴到 去项目的资源文件夹里,在配置文件里修改一下路径和IOAdapte:

改了HanLP的词典就意味着着非要用maven直接导入仓库里的包了,非要直接将修改后的data文件贴到 去本地,否则指定路径给HanLP。搜了一下网上什么都有办法 ,也有 在项目部署的那末 ,把HanLP的词典数据贴到 去服务器上4个多固定位置上,否则再配置HanLP的配置文件,指定4个多固定位置。你你这个办法 虽然直接,否则非要把HanLP的词典数据跟整个项目打包到一起去,管理起来很麻烦。假如把数据直接作为项目的资源文件,部署到Tomcat上后无论如保么会在配置里写路径也有提示找非要词典文件。研究了一下HanLP的issue那末 ,我发现你你这个项目支持自定义读写文件的IO类。在4个多将词典数据贴到 去HDFS上的4个多blog启发下,我就要了4个多很鸡贼的办法 ,我重写4个多IOAdapter类,使用读写静态资源文件的办法 读取词典数据了,那末 不就可不可否 把data跟项目打包到一起去了嘛。

文章来源于狼血wolfblood的博客

我可是知道正确的补救方案应该是啥,感觉你你这个办法 还是很鸡贼的。

代码如下:

事情是那末 的,最近实验室在搞4个多Java Web的项目,用的Spring MVC的框架。项目组有什么都有没做过Spring的学弟学妹,为了提高速率,我让否则 人儿本人先抛开Spring来写本人负责的模块,我来把各个模块在Spring里集成。

项目里4个多多文本分析的模块是4个多学妹负责的,顶端用到了HanLP,我在集成的那末 直接用maven上加的依赖,等集成好了测试的那末 发现如保么会也测不过,问了学妹才发现为了做实体识别,她用了4个多很有意思的办法 ,本人改了HanLP的词典,手动加了好多词,否则后期版本迭代中还有可能继续改。。。。