如何从中文姓名推测性别

如何从中文姓名推测性别

从中文姓名推测性别,例如:
输入:刘德华
输出:男

输入:周慧敏
输出:女

输入:刘婷
输出:女

输入:三毛
输出:[男0.6,女0.4]
大概就是分解名字。把姓去掉(需要一个复姓列表)
然后看名字,如果是草字头,女字旁等等就女可能的多一点
诸如此类。
不过,说起来容易.....做起来难啊.
哦,Ruby和Rails可以做这个嘛?嘿嘿!
如果女人用一个男人的名字呢?或男人用了一个很女人气的名字呢?
生活中总有这样的事呀,那怎么推测呀?
人工智能,ruby强项啊,用ruby来做应该不难的。。。
汗。。。好强的题目。
跟同学讨论了一下,有如下结果。
1.需要把姓名中的常用字分类(男名常用字,女名常用字)
2.适合做成web程序,这样可以从得到的结果分析后放到数据库里,程序会越变越聪明。
我觉得这个题目放在应用中的意义不大,放在游戏中还比较有意义。如果是web应用的话,直接加一个性别栏就没事了。把这个功能加到应用中,好像又加大了服务器和数据库的负担但是又很难讨好各位。
引用:
原帖由 maninred 于 2007-11-24 21:46 发表
我觉得这个题目放在应用中的意义不大,放在游戏中还比较有意义。如果是web应用的话,直接加一个性别栏就没事了。把这个功能加到应用中,好像又加大了服务器和数据库的负担但是又很难讨好各位。
这不就是 模式识别 的范畴吗? 要先让程序“学习”,然后它就知道“男女”了。
嗯,好课题。程序不是很难,难的是积累数据库。呵呵。