这是一个创建于 4455 天前的主题,其中的信息可能已经有所发展或是发生改变。
业余在做一个机器抓取网上文章在整合发布的网站。现在想用机器学习之类的技术能把文章按不同的内容进行分类,请问应该怎么做?谢谢!
4 条回复 1970-01-01 08:00:00 +08:00  | | 1 likai 2013-08-04 21:28:56 +08:00 via Android 1 中文分词作tag |
 | | 3 maxint64 2013-08-04 22:17:59 +08:00 分词是第一步,之后是为文章建立模型,然后是做聚类。 |
 | | 4 binux 2013-08-04 22:23:07 +08:00 标记,分词,找个库扔进去训练就完了 如果觉得觉得麻烦,手动提取特征tag |