请问,b站这个搜索功能怎么做到的?

如图,我搜索内容“亚洲白桦”,划到下面的视频发现这些视频标题虽然没有关键字,但是它们的视频语音里有“白桦林”(这些视频是没有字幕的)点进这些视频还会自动跳到对应的进度条,想问一下这是怎么实现的(我个人猜测是对视频的语音进行识别转成文字然后和关键字“亚洲白桦”进行匹配,但这样感觉太费空间了吧,b站上有那么多视频,可以做到每个视频都进行语音识别吗?而且为什么它能直接找到视频中关键字“白桦林”出现的地方)
求各位大佬解答,谢谢!
(我是大二学生,对人工智能这方面挺无知的,麻烦大家轻喷)

望采纳


没有你想的这么复杂,实际上B站有一些资源可以实现这个功能:

  • ① B站对视频会做大量的“内容画像”,包括基于评论、弹幕、运营内容标签的挖掘整理。因此tag库里可能有 白桦
  • ② 用户的历史搜索点击和观看记录,可以构建集体智慧关联,比如 白桦 相关的搜索下,用户发现了这个视频,并且点击和完整观看,会形成记录。这些用户行为可以把keywords和视频关联上。

鄙人在百度、阿里、美团点评的AI算法部门工作过10年+,有一些内容放在我的网站上了,也欢迎你学习交流啊