
1 eric 2012-07-23 16:45:14 +08:00 NLTK 的 word_tokenize 就能很方便的实现。 http://nltk.org/ |
2 stackpop OP @eric 的确好强大,就是我想要的东西。之前打算用C++ 写,后来朋友建议用python,代码简洁得多,果然py强大~难怪国外好多大学CS第一门编程课改成python了,呵呵 |
3 fanzheng 2012-07-24 00:08:04 +08:00 如果只是出现次数的话用split然后counter()嘛,官方模块文档里面的counter() |
4 from0tohero 2012-07-26 18:39:19 +08:00 NLTK最好没有之一~ |