注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

沧州黄智,中国民间第一博、自干五、大丈夫

法律和政策是我的纲领,党中央和国务院是我的向导,为实现中国梦而献身是我的崇高愿望

 
 
 

日志

 
 

计算机识读汉语词组断限难题的攻破?  

2016-03-10 17:03:59|  分类: 技术 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
  “1942年就读于敌伪管辖所不及的苏州中学常州分校,正式成为吕先生的学生”。任何人都会把其中的“管辖所不及”读为“管辖│所不及”。但是计算机就不行了,它很可能读为“管辖所│不及”。如何让计算机识别这类对词组来说既可归前(与前边搭配)又可归后(与后边搭配)但对句子来说只能归为一边(与一边搭配)的字或词,让科研人员包括北大的教授们伤透了脑筋、绞尽了脑汁,但至今仍毫无办法。我觉得解决这个问题易如反掌。汉语句子中的词与词之间没有间隔,而字母文字句子中的词与词之间有间隔,上述问题只要“攻错”一下——留出间隔——不就解决了吗?前面的例句写为“1942年就读于敌伪管辖 所不及的苏州中学常州分校,正式成为吕先生的学生”计算机识读就不会出错了。就是这么一层窗户纸,但不捅不破。
  评论这张
 
阅读(66)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2016