把自己发的微博爬下来,用 numpy 和 matplotlib 绘制而成图片,图片中的文字是微博中出现频率最高的词语
1 keisuu 2017-02-17 21:21:49 +08:00 不明觉厉 |
![]() | 2 zzcchh 2017-02-17 21:28:58 +08:00 哥们,真 666 |
3 qingshi 2017-02-17 22:02:52 +08:00 分词是怎么处理的? |
![]() | 5 lzjun OP @kuntang 是用的结巴分词,不过它的局限在在于没法处理 HTML 标签。论英文分词还是 Java 中的 Lucene 牛 |
6 newbie269 2017-02-17 22:59:59 +08:00 挺有想法的 |
![]() | 7 sparkssssssss 2017-02-18 14:09:24 +08:00 via iPhone 马克下 |
9 mingyun 2017-02-19 13:17:10 +08:00 $ python heart.py Traceback (most recent call last): File "heart.py", line 9, in <module> from scipy.misc import imread File "d:\python3\lib\site-packages\scipy\__init__.py", line 61, in <module> from numpy._distributor_init import NUMPY_MKL # requires numpy+mkl ImportError: cannot import name 'NUMPY_MKL' 这个怎么办? |