只提供采集思路,其他自己解决。
1、爱奇艺视频的评分怎么采集?
抓取:data-qipuid="[参数]" 或 advideo_qipuid:'[参数]',
拼接:http://score.video.iqiyi.com/beaver-api/get_sns_score?qipu_ids=[参数1]&appid=21&tvid=586548800%2C102051000%2C332987900%2C581546200%2C220173800%2C255582000%2C455770800%2C264561100%2C113222900%2C586559800%2C581521500%2C105291700%2C101341000%2C333358600%2C103654600%2C154980000%2C335357200&pageNo=1
2、爱奇艺采集的视频超过50集了?
抓取:albumId: [参数],
剧集拼接:http://cache.video.iqiyi.com/jp/avlist/[参数1]/1/
综艺拼接:http://cache.video.iqiyi.com/jp/sdvlst/6/[参数1]/
1为翻页参数、6为综艺的分类ID
3、优酷电影的播放列表有分段视频,怎么采集完整视频?
抓取:showid:"[参数]",
拼接:http://list.youku.com/show/module?id=[参数1]&tab=showInfo&cname=%E7%94%B5%E5%BD%B1&callback=jQuery111205153485401023041_1494089501994&_=1494089501995
内容匹配:<li><dl><dt><a class=\"c555\" href=\"[参数]\" (*)<\/a><\/dt><dd>[参数]:[参数]:[参数]<\/dd><\/dl><\/li>
最后组合结果并处理结果就可以了。
4、苹果CMS火车头采集标签组合结果不能包含$符号?
用其他符号代替,例如将#替换成$,即可
5、苹果CMS中标题/副题包含了英文冒号发布不成功?
将英文冒号替换成中文冒号
6、AcFun.tv C值火车头怎么抓取?
抓包获取分类列表地址,列表中获取内容地址,在内容地址中获取视频的真实ID,
拼接:http://www.acfun.tv/video/getVideo.aspx?id=[参数1]
7、火车头怎么抓取58同城招聘人电话等信息?
内容页抓取:userid":[参数],"
拼接:http://qy.m.58.com/m_detail/[参数1]/
8、芒果视频如何采集100集以上的内容?
页面内容抓取:vid: [参数],
拼接:http://pcweb.api.mgtv.com/episode/list?video_id=[参数1]&page=1&size=50
超过50集了把这个page=1参数改下就行了
原创文章,转载请注明: 转载自荣耀博客
本文链接地址: 火车头视频采集相关问题
本文链接地址: 火车头视频采集相关问题