【更新】对不起大家qwq之前的正则表达式提取汉字和删人名的部分有点问题!!!现在已经修复过来了!!!口语语料库总有效字数10***62字!中国人说的“是”字最多。
不是“的”也不是“了”。
“的”仅仅排第三,“了”字甚至没有进前十。
这个问题不能直接照搬现有的字频数据啦。
既然题主问的是“中国人 说哪个字最多”,那么我们不能统计书面语语料,必须统计口语语料,甚至使用聊天记录都会有一定的偏差,因为我们打下的字不一定…。
为什么要学go语言,golang的优势有哪些?
男朋友说我穿衣服太开放,难道好身材不应该显示出来吗?
鸿蒙电脑会在国内逐渐取代windows电脑吗?
手机存储器为什么会出现速度倒挂的现象,外存比内存快?
为什么 Linux 软件安装包会有依赖关系,而 Windows 软件安装包不需要?
学生校服如何隐藏内衣痕迹?
obsidian用一两年后会有多大?全文搜索还快吗?
如何评价“寡姐”斯嘉丽·约翰逊的身材?
为什么 CRT 画质这么好也被淘汰,液晶反而发展的很好?
adobe全套都用开源软件或者免费软件来替代,能做到吗?
电话:
座机:
邮箱:
地址: