python opening
淘宝搜:【天降红包222】领超级红包,京东搜:【天降红包222】
淘宝互助,淘宝双11微信互助群关注公众号 【淘姐妹】
^{1}$
本项目包含了由THUNLP开发的知网核心数据和openhownetapi,为在知网中搜索信息、显示义素树、通过义素计算词的相似度等提供了一种方便的方法,您也可以访问我们的website来享受在线搜索和展示单词义素的乐趣。在
如果您在研究中使用OpenHowNet提供的任何数据或API,请引用以下论文:
知网核心数据文件()由223767个中英文单词和短语表示的概念组成。HowNet中的每个概念都使用基于词素的定义、词性标记、情感或词性、示例等进行注释。以下是如何在HowNet中注释概念的示例:
^{pr2}$- Python==3.6
- 任意树==2.4.3
- tqdm==4.31.1
- 请求==2.22.0
- 通过pip安装(推荐)
pip install OpenHowNet
- 通过Github安装
git clone https://github.com/thunlp/OpenHowNet/ cd OpenHowNet/OpenHowNet bash merge.sh
interfaces | description | params |
---|---|---|
get(self, word, language=None) | Search all information annotated with a word. | ^{ |
get_sememes_by_word(self, word, structured=False, lang='zh', merge=False, expanded_layer=-1) | Search sememes of the target word. You can choose whether multiple senses in the result are merged, whether the result itself is structured, and the expand layers of the tree. | ^{ |
initialize_sememe_similarity_calculation(self) | Initialize the implementation of ad【【微信】】late sememe-based word similarity. It may take some time to read necessary files. | |
calculate_word_similarity(self, word0, word1) | Calculate similarity of two words. You need to run last initialization command before calling this function. | ^{ |
get_nearest_words_【【微信】】elf, word, K=10) | Get the nearest K words to the target word with similarity calculated 【【微信】】. | ^{ |
get_sememe_relation(self, sememe0, sememe1) | Get the relationship between two sememes. | ^{ |
get_sememe_via_relation(self, sememe, relation, lang='zh') | Get all sememes that ha【【微信】】ith the input sememe. | ^{ |
初始化
importOpenHowNethownet_dict=OpenHowNet.HowNetDict()
如果您没有下载知网数据,则会发生错误。在这种情况下,您需要先运行。在
在知网中获取单词注释
默认情况下,api将在知网的英文和中文注释中搜索目标单词,这将导致大量的搜索开销。注意,如果HowNet注释中不存在目标单词,这个api将简单地返回一个空列表。在
>>>result_list=hownet_dict.get("苹果")>>>print(len(result_list))6>>>print(result_list[]){'Def':'{computer|电脑:modifier={PatternValue|样式值:CoEvent={able|能:scope={bring|携带:patient={$}}}}{SpeBrand|特定牌子}}','en_grammar':'noun','zh_grammar':'noun','No':'127151','syn':[{'id':'004024','text':'IBM'},{'id':'041684','text':'戴尔'},{'id':'049006','text':'东芝'},{'id':'106795','text':'联想'},{'id':'156029','text':'索尼'},{'id':'004203','text':'iPad'},{'id':'019457','text':'笔记本'},{'id':'019458','text':'笔记本电脑'},{'id':'019459','text':'笔记本电脑'},{'id':'019460','text':'笔记本电脑'},{'id':'019461','text':'笔记本电脑'},{'id':'019463','text':'笔记簿电脑'},{'id':'019464','text':'笔记簿电脑'},{'id':'020567','text':'便携式电脑'},{'id':'020568','text':'便携式计算机'},{'id':'020569','text':'便携式计算机'},{'id':'127224','text':'平板电脑'},{'id':'127225','text':'平板电脑'},{'id':'172264','text':'膝上型电脑'},{'id':'172265','text':'膝上型电脑'}],'zh_word':'苹果','en_word':'apple'}>>>hownet_dict.get("test_for_non_exist_word")[]
您可以将检索到的HowNet结构化义素注释(“义素树”)可视化如下(K=2表示只显示由输入词表示的两个概念的义素树)
>>>hownet_dict.【【微信】】s("苹果",K=2)Find6result(s)Display#0 sememe tree[sense]苹果└──[None]computer|电脑├──[modifier]PatternValue|样式值│└──[CoEvent]able|能│└──[scope]bring|携带│└──[patient]$└──[patient]SpeBrand|特定牌子Display#1 sememe tree[sense]苹果└──[None]fruit|水果
为了提高搜索过程的效率,可以指定目标单词的语言如下。在
>>>result_list=hownet_dict.get("苹果",language="zh")>>>print("Number of monolingual results: ",len(result_list))Numberofmonolingualresults:6>>>print("Example of monolingual results: ",result_list[])Exampleofmonolingualresults:{'Def':'{computer|电脑:modifier={PatternValue|样式值:CoEvent={able|能:scope={bring|携带:patient={$}}}}{SpeBrand|特定牌子}}','en_grammar':'noun','zh_grammar':'noun','No':'127151','syn':[{'id':'004024','text':'IBM'},{'id':'041684','text':'戴尔'},{'id':'049006','text':'东芝'},{'id':'106795','text':'联想'},{'id':'156029','text':'索尼'},{'id':'004203','text':'iPad'},{'id':'019457','text':'笔记本'},{'id':'019458','text':'笔记本电脑'},{'id':'019459','text':'笔记本电脑'},{'id':'019460','text'MI 小米 RedmiBook15E 酷睿i5/i7 小米轻薄学习办公笔记本
京公网安备11010602100083 | 电信与信息服务业务经营许可证:京ICP证160379号 | 京ICP备12048526号-2
营业性演出许可证 京演(机构)[2020]4453号 | 互联网药品信息服务资格证书 (京)-非经营性-2022-0049 | 营业执照
广播电视节目制作经营许可证(京)字第07726号 | 北京市诚信创建企业
违法和不良信息举报/涉未成年人及举报电话:【【手机】】-9 | 违法和不良信息举报邮箱:【【邮箱】】
? copyright 2010-2022 值得买科技. All rights reserved. 版权所有 本站内容未经书面许可,禁止一切形式的转载。
版权声明:除非特别标注原创,其它均来自互联网,转载时请以链接形式注明文章出处。