量子位 宣布 | 公众号 QbitAI
爱奇艺最近公开了一个数据集,名叫iQIYI-VID。
公开这个数据集的爱奇艺官方给它确认的种别号字叫“多模态视频人物数据集”,翻译成人话,便是有很多人,每个人用不同的“姿势”拍视频,网络起来攒成的数据集。
只不过,这些人相比拟较有名,有赵丽颖、吴亦凡和蔡徐坤……
全体数据集非常弘大,包含5000个艺人,近60万条视频,每条视频长1~30秒。
数据集中的每个视频片段都经由人工注释,缺点率低于0.2%。
个中收录了一些同一个艺人都的不同造型,比如,有发型新奇的吴亦凡
还有发型比较常规的吴亦凡
有穿红衣服的赵丽颖
还有穿蓝白衣服的赵丽颖
以及穿同样衣服的蔡徐坤和……抱歉,脸盲的量子位认出蔡徐坤已经是极限了。
全体数据集中,大部分明星都拥有10~50个视频,有50~100个视频或100~300个视频的也不少,但只有少量头部艺人拥有300个以上的视频。
而根据年事来看,主力军竟然是30多岁的明星艺人,其次才是40多岁的明星,30岁以下的明星只有不到600个。原来年纪大了也可以出道啊?
末了,大部分视频都是在5秒钟以内,非常简短,节省打算资源。
有什么用
不过,把这些明星艺人的视频搜集到一起,究竟能炼什么丹呢?
紧张可以做三件事:
第一,人脸识别
5000个人呢,辨认一下谁是谁。不过人脸识别实在是太普遍了。
第二,说话人识别
基于音频的说话人识别,演习机器听声音,判断是谁在说话。
目前这方面的资料不是很多,这方面最大的免费数据集是VoxCeleb和VoxCeleb2;其余美国国家标准技能研究院(NIST)曾经做过一些事情,但是那些数据集不是免费的。
第三,基于身体特色的职员重新识别
根据身体特色,判断不同镜头中的人是否为同一个人,目前紧张还是用单帧的方法,从视频中抽取单帧图像,通过图像切割、骨架点定位、姿态校准进行比较。
综艺节目再利用至于这些视频是哪儿来的嘛,自然是要感谢爱奇艺作为视频网站的老本行。
这些视频片段是从40万小时的电影、电视剧、综艺、新闻视频中剪出来的,内容源自爱奇艺网站上TOP 50万的热门视频。
将这些热门视频按照分镜头剪开后,不到一秒的视频由于信息不敷被丧失落,超过30秒的视频考虑到打算负载过大也被删掉了。
之后,去掉噪声,根据每个人的衣服或人脸特色来归类,匹配到爱奇艺的名人数据库,从而天生针对每个不同人物的视频数据集。
传送门论文
https://arxiv.org/abs/1811.07548
数据集地址(须要登录下载)
http://challenge.ai.iqiyi.com/detail?raceId=5afc36639689443e8f815f9e
— 完 —
诚挚招聘
量子位正在招募编辑/,事情地点在北京中关村落。期待有才华、有激情亲切的同学加入我们!
干系细节,请在量子位"大众年夜众号(QbitAI)对话界面,回答“招聘”两个字。
量子位 QbitAI · 头条号签约作者
վ'ᴗ' ի 追踪AI技能和产品新动态