English
百年新闻
业界新闻
百年公告
2006年互联网新热点 视频搜索“暗潮涌动”
2006-07-24 17:04:13.4
计世网 视频搜索技术针对音视频这类非结构化数据,使用了自动数字化、语音识别、自动抽帧和内容自动关联等技术,真正做到了从内容上对视频进行搜索。2006年互联网行业的新热点是各类垂直搜索,随着行业细分
,视频搜索将激荡起搜索领域内的一轮新热潮。

“如果你错过了世界杯,那么你一定不能错过视频搜索,它像个遥控器,能带你到每一个精彩进球的视频帧。”

当登录进视频搜索网站,用户可以通过关键字定位到视频中的某句话或某个帧,实现对视频新闻信息的内容检索。如果用户输入检索世界杯英格兰某场比赛的进球,系统可以准确地定位到该粒进球的视频片断,甚至是某一具体的关键帧。对用户来讲,搜索到了更为准确的视频内容,提高了搜索效率,节省了用户时间。

其次是世界杯内容的预览功能。搜索结果显示之后, FLV播放器会根据用户搜索条件进行预览播放,一般情况下会提供给用户10-15秒的预览片断,供用户选择是否播放完整视频片断。用户如果想预览某条世界杯内容,只要点击“预览”功能按钮就能实现。通过预览,用户可以大致判断视频内容,确定有无进一步了解的必要,而无需花费更多时间打开视频原件。提高用户体验的同时,也提高了搜索效率,使用户能够直接准确的欣赏到自己喜欢的视频内容。FLV预览播放器还提供全屏播放功能,全屏窗口中可以提供更多的用户选择,例如用户可以连续播放搜索结果,每一个预览播放的同时,都会自动提示给用户关联视频,用户可以直接选择进行预览播放。

这些不同寻常的功能,均来自于视频搜索独特而实用的音视频处理、索引技术和内容自动关联技术。它改变了以往的搜索只能把音视频文件看成一个文件从而搜索文件名的做法,真正做到了对音视频文件的内容搜索。

  视频搜索技术针对音视频这类非结构化数据,视频搜索使用了自动数字化、语音识别、自动抽帧、文本挖掘和内容自动关联等技术,真正做到了从内容上对视频进行搜索,搜索结果可以直接定位到视频中出现的某句话的时间点或关键帧,可以形象地称之为互联网视频的“遥控器”。

视频搜索 呼之欲出

百度上市,雅虎转型,搜索已经成为2005年互联网行业关注的焦点。焦点的出现源于网民对互联网服务层出不穷的新需求,这也是市场细分和产品细分的结果。正是该需求的推动,包括社区搜索、购物搜索、旅游搜索等各类垂直搜索成了2006年互联网行业的新热点。传统的针对文字等结构化信息的搜索技术已经不断成熟,企业争夺的焦点则是行业细分。而对于音视频等非结构化信息的搜索随着互联网多媒体信息的繁荣和网民对于视频节目需求的增加也开始得到企业和用户的关注。

视频搜索功能实现了对视频文件的全内容搜索,使用关键词、句子甚至自然语言,用户均可以迅速搜索到符合条件的电视新闻资讯片断、电视节目片断以及网络视频、网络播客、音频网站上相应的音视频内容,并实现
高速在线播放。内容自动关联技术,为每一个用户的每一次搜索提供了个性化的相关音视频内容的推荐。

视频搜索类别

不论是互联网巨头谷歌(Google)、雅虎(Yahoo)、微软,还是在本土市场占得一席之地的百度(Baidu)、iask,或者以专业角度切入的Qihoo, openv,搜索引擎厂商已纷纷涉足视频搜索。

早在2003年的5月,Google的联合创始人 Sergey Brin 就与Google的其他开发人员联合发表了一篇文章,讨论如何建立网页新闻与广播电视新闻的相关性这一主题。他们的目标是要开发一种技术,可以使用户在电脑上看电视的时候,可以根据链接去看相关文章,并提高彼此之间的相关性。这种做法已经被电视网或提供低像素视频的网站在促销其他节目的时候广泛使用。


但问题是,如何计算出在一个视频文件中内容的相关性?他们的做法是通过邻近标题记录分析在类似一段CNN标题新闻的视频中所说的话语内容的全部文本。没有录音记录,根本不可能决定相关性。

与传统网页搜索不同,视频文件属于非结构化信息。目前市场上视频搜索技术中以文件名或标签进行搜索和通过视频内容进行搜索最为常见。

1.通过文件名或标签进行搜索

现在,大多数网络搜索在查找多媒体文件时是通过视频文件的名字或其他标签,如视频文件的标题、作者、摘要、关键词等,然后提供链接使其他网站链接到该文件。

例如Google就是依赖文件名或视频的标签分析来提供其视频搜索服务。

2.通过视频内容进行搜索

该技术是对视频内容进行分析处理,转换成结构化信息进行标记。主要表现为通过对视频资料进行数字化处理,然后利用语音识别技术提取文件中有用的内容进行标记,最终通过检索展现给用户,并能实现关键帧定位。

传统搜索基本上采用文件名或标签搜索方式,也就是“非0即1”的方式,它基于严格定义和分类的布尔表达式,即“与、或、非”表达式。这样搜索的最大弊病就是,如果关键词不确定,或者有错误疏漏,用户往往得不到自己想要的搜索结果。

采用内容搜索方法,可通过判别相关度来对数据进行检索和筛选,根据用户输入的词、句子或段落,引擎会对搜索条件进行分析,通过模式识别或概念匹配的方式,找出在内容上最接近的搜索结果提供给用户,用
户可以按相关度排序来找到自己满意的结果,可以避免传统“关键词检索”造成的漏检情况的发生。这项技术通过综合考虑词语出现的频率及上下文,可以避免许多单纯依赖关键字检索出现的错误查询结果,同时又能够查到那些可能不包含具体关键字、但包含相关概念的文档。如果说传统的搜索方法为“search”(搜索)的话,那么通过概念来检索的方法则应该称为“discover”(发现),因为它可以让用户发现一些事前他们不知道的信息。

搜索技术的差异性将直接决定搜索的准确性和人工处理的成本,用户体验也会产生较大差异。

商机凸现

 视频搜索可以形成一个长期的新的广告收入模式,可以假设,在用户等待搜索结果下载的时间里,系统知道他正在搜索的词,然后就向他播放和这个词相关的广告,其针对性比电视里的铺天盖地的广告更强。对于电视台来说,视频搜索技术还利于对视频广告的投放效果进行跟踪,从而进一步衍生出各种形式的新广告业务。目前视频搜索领域至少涌现出三个新星TVEyes、BBN 和Autonomy (即 Blinkx)加入角逐,它们都可以提供全文语音搜索服务。这些公司大都从为政府完成语音识别搜索项目起家。美国国防部对于能够在一大堆音频和视频资料中实现搜索有着浓厚的兴趣。事实上,几乎所有的语音识别软件,都来自于1970年代以来美国国防部高等研究计划局(DARPA)-资助的研究项目。

在TVEyes的Podscope.com,则可以搜索10万个音频和视频博客,这给了那些音频、视频博客一个将自己的网站提交给搜索引擎的机会。使人们可以发现那些业余内容创造者就某一相关主题展开的相关表达,便于这些博客的传播。可以设想,当IPTV和视频博客迅猛发展的时候,我们将面临的是成千上万个“频道”,如果在这些“频道”里找到想要的东西?仅仅靠翻阅是无法实现的了,必须借助视频搜索这个“遥控器”。

虽然在音频视频领域,目前还没有像Google和Yahoo!这样的搜索引擎霸主出现,也没有建立像TVGuide.com那样值得关注的节目指南,但越来越多竟争者的已经加入进来,试图在视频领域内,瓜分份额巨大的互联网广告收入。



产品演示demo    在线试用     产品升级     网站地图     百年论坛
北京百年创业技术有限公司版权所有 
邮编:100083 Email:e80@e80.com.cn 总机:(010)51265611
服务热线:(010)62351657 销售热线:(010)51265611