FEBRUARY 12, 2008
谷歌拼音输入法的化学专业词典
简介
可以用于谷歌输入法的词典文件,包含大量中文化学词汇,多为化合物名称。词库容量很大,有15976条化合物名称中文词汇;包括各种多音字拼写(也包括拼错的)共有拼音条目6万余条。比较搜狗拼音化学词汇大全【官方推荐】的一千多条的量要大多了。
使用方法
在谷歌拼音输入法的"属性设置"中导入
数据和制作方法
化合物中文名称,从Chemblink.com网站上采样获得。
词汇提取程序使用Python编写。其中,从unicode字符串中提取汉字的正则表达式:
ur'([\u4e00-\u9fa5]+)'
汉字到拼音的转换程序,使用了roy在水木上贴的python代码和数据库。
谷歌拼音输入法的词典格式和分析方法,在前一篇中有所介绍。
使用授权
随便用。随意转载、修改、使用,不必注明原作者。对词典的正确性、全面性作者无法保证和负责。
下载
google.pinyin.dict.for.chemists.zip
Filed by charlie at 7:33 am under Python, Tools, chemoinformatics
--
7#625 Dorm of Student, Xiamen Uni. Xiamen, Fujian Province, China
Wen Ruibin 文睿彬
没有评论:
发表评论