博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
深蓝词库转换2.4版发布,支持最新的搜狗用户词库备份bin格式
阅读量:7200 次
发布时间:2019-06-29

本文共 510 字,大约阅读时间需要 1 分钟。

很高兴的告诉大家,感谢GitHub上的h4x3rotab提供python版的搜狗用户词库备份bin格式的解析算法,感谢tmxkn1提供了C#版的实现,深蓝词库转换终于迎来了一个重大更新,能够支持搜狗用户词库的bin格式备份的导出了。再也不用受到搜狗输入法的钳制,可以自由切换到其他输入法了。搜狗bin词库只解析到了用户词条和词频,没有拼音,所以如果要导出其他拼音输入法,中间转换工具会根据词条的内容重新生成拼音。

另外在2.4版中,增加了用户词频强制设置的功能,比如将搜狗用户词库bin格式备份转换为Win10自带的微软拼音,那么词频会导致该词条在微软拼音上的位置不对,那么我们就需要忽略掉搜狗bin格式解析出来词频,而是使用1表示词频,这样在微软拼音中才会显示正常。

设置了强制的默认词频后,所有词频将按照新词频算法生成。

导入到Win10自带微软拼音的用户自定义短语后的效果如图:

最新版的深蓝词库转换的下载地址:

最后,再声讨一下一个叫“ 奥创词库转换”的,把我的深蓝词库转换代码拿来改一下界面,就变成了自己的软件,极度无耻和恶心。深蓝词库转换一直是免费绿色开源的,但是也看不惯这种无底线的剽窃行为,强烈谴责一下。

转载地址:http://ezdum.baihongyu.com/

你可能感兴趣的文章
[翻译] JTNumberScrollAnimatedView
查看>>
Groovy语法介绍
查看>>
玩转2048,不如搞定2048
查看>>
第一米店Diyimi.net 域名交易
查看>>
IOS中表视图(UITableView)使用详解
查看>>
Lua talbe's pairs & ipairs & traverse loop, table.pack and table.unpack
查看>>
主机使用wifi时,虚拟机的网络配置
查看>>
本地存储—localStorage(HTML5)
查看>>
常见时间复杂度排行
查看>>
网络加密的三种方式及比较
查看>>
服务器编程之路:进无止境(下)
查看>>
自定义jackson解析时间格式yyy-MM-dd HH:mm:ss
查看>>
unity3d Shader开发简介
查看>>
Linux——ELK(Elasticsearch + Logstash + Kibana)企业日志分析之linux系统history收集展示
查看>>
我的友情链接
查看>>
变态工作之修改hibernate让其支持null主键
查看>>
ActionScript3 基本语法
查看>>
shiro-demo
查看>>
模态窗口错误 Application tried to present modally an ac
查看>>
通过MyEclipse生成Hibernate类文件和hbm.xml文件,或者annotatio...
查看>>