
只是爬取门户网站于公众号? 请问下 v 友们有知道的比较详细的吗?或者有相关的文章与图书推荐的吗?谢谢
1 happinessnch 2021-05-13 08:23:36 +08:00 找实习生来爬虫+洗稿吧, 盲猜的,这种是成本最小的, 主打算法千人前面,内容保持不慢于行业太多,慢慢用户多了,再考虑自创内容。 |
2 Rocketer 2021-05-13 08:27:12 +08:00 via iPhone 根本不洗稿,人家都注明出处的,只是没有授权,不让爬硬爬而已。 实习生确实有很多,但不是洗稿用的,而是给文章打 tag 的,否则怎么按兴趣推荐? |
3 reiji 2021-05-13 08:28:10 +08:00 http://www.chinanews.com/cj/2014/06-06/6250065.shtml 随便一搜就有,当时闹得还挺大的,搞得我有几年一直以为这个项目已经没了 |
4 EIJAM 2021-05-13 08:39:45 +08:00 via iPhone 不要脸硬爬。反正就算打官司也要过好几年了,先抢到流量就行。 |
5 murmur 2021-05-13 08:44:01 +08:00 洗稿啊,多简单,搜今日头条 抄袭 要多少有多少 |
6 xingshu1990 2021-05-13 08:48:45 +08:00 简单:知网、万方上的 PDF 或者本身自己格式的内容,全部下载过来,购买泰比( ABBYY )训练 OCR 中文词库,然后 OCR 出来的内容,进行人工校对,混编。 或者就是开着某车头采集过来,进行软件,或者人工混编。 |
7 yitingbai 2021-05-13 08:59:28 +08:00 我是今日头条最早最早的用户, 那时候用的人都不多, 反馈问题客服马上就回复了, 可以肯定的说, 所有文章都是爬来的, 后来用户多了才开始做自己的内容, 扶持创作者 |
8 konnnnn 2021-05-13 09:10:15 +08:00 今日偷条,贴吧帖子都偷不少 |
9 lostSoul 2021-05-13 09:30:18 +08:00 你们想得太夸张了,, 这种行业很多 很多都是人工操作 可以去搜搜网站编辑岗位 基本都是这种 每天公司会给他们一个标签或者标题,然后叫他们去各种网站 copy 拼接,老缝合怪了 内容看起来多就好 不需要流畅 |
10 bullfrog 2021-05-13 09:58:38 +08:00 via iPhone 这类问题还有抖音的初创内容是怎么开的 |
11 aogu555 2021-05-13 09:59:34 +08:00 都是人编的,头条早期烧钱很厉害,头条发新闻几乎没有审核,1w 阅读大概 10 元左右,还在上学的我靠一个科技类账号每月赚几千生活费,那时候历史类和生活类是最赚钱的,那时候各种新闻类 app 疯狂烧钱,头条号,大鱼号,搜狐号,企鹅号,人人都能发新闻,现在假新闻泛滥字节跳动功不可没。https://www.sohu.com/a/62620237_118786 |
13 dawangyezi 2021-05-13 11:49:19 +08:00 爬来的 |
14 gxt92 2021-05-13 13:24:56 +08:00 冷启动吧,内容爬虫、寻找种子用户、核心创作者、创建社区 |