声明:该博客内容仅供学习参考,请勿用于商业目的
感谢:本文参考了网上众多B站视频下载的技术分享,并且分析了一下kanbilibili.com和ibilibili.com的后台交互。
经过不断的抓包、分析与摸索,找到获取B站视频的基本技术途径,本文将简单的描述一下,获取相关数据的方式和一些坑点。
一、数据接口
- 获取UP所有视频的API接口
http://space.bilibili.com/ajax/member/getSubmitVideos
- 获取UP某频道内所有视频的API接口
http://api.bilibili.com/x/space/channel/video
- 获取UP某一期视频信息的API接口
http://api.bilibili.com/x/web-interface/view
- 获取UP某一期视频中某P视频信息的API接口
http://api.bilibili.com/x/player/playurl
- 获取UP个人公开信息的API接口
http://api.bilibili.com/x/space/acc/info
以上接口均可不使用https进行访问,访问参数参考下文
二、数据参数
所有的接口均采用GET请求进行访问,并且不需要cookie信息
只有需要获取高清晰度的视频时才需要cookie信息(最好是有大会员的cookie信息)
URL参数其实各位都可以自己抓到数据,我强调一下几个坑。
- 在B站的后台中常常有id名和用户看到的不一致,例如视频常常用avXXXXXXXX进行表示,但是在后台数据中,则用aid表示av号,类似问题需要注意。
- av号并不是最小单位,因为UP每发的一个视频,都可以包含多个视频,即:分P。所以每P才是最小单位,每个视频都有独立的编号,而不是用av号进行编号的。
- 在下载高清视频时,只需从用户的cookie信息中挑出“SESSDATA”字段即可,其他cookie信息不重要(我用大会员帐号测试的)。如果请求的画质高于该用户可看的最高画质,则自动返回用户可看的最高画质的视频。
- 近期的视频中,B站采用声音与视频分离的模式下载两种数据,可用flv与aac文件进行表示。在早起视频中,声音与视频都在同一个文件中,可用MP4或flv文件进行表示。
编程实现大家加油,我也在用Python封装这一下载过程,欢迎关注我的博客,跟进该项目的开发情况。