之前为了庆祝‘花’园免费相册图片累计上传量超过十亿,‘花’园网同钓网搜索合作推出了一个名叫“Ta是?”的图像识别应用,在‘花’园网相册上增加“Ta是?”的按钮,点击之后鼠标指针就会变成放大镜图标,再在相册图片上面点击一下,就能够自动分析识别所指位置处的人物、动植物,以及建筑车辆等常见物品的基本信息。人物可以识别出男‘女’、年龄、职业以及姓名,动植物则能够识别出品种、雌雄,汽车电视电脑手机扳手牙膏等生活中常见物品也能够识别出名称和颜‘色’,如果有相关新闻以及蜜蜂百科词条的话,还会同步显示这些内容。
其实他们这时候推出“Ta是”应用,目的根本不是所谓庆祝,而是为了转移视线以及炫耀技术,趁着梦行者登上TBBT星战日特辑的机会趁热打铁树立蜜蜂高科技的形象。而很快,网友们就发现安装绿霸,然后用各种含有黄颜‘色’甚至绿‘色’的图片喂食绿霸,观察它的反应其实很无聊,这里有了一个更加好玩,胃口更好的“Ta是”可以喂食。于是乎全民围观调戏绿霸娘的热‘潮’很快消退,取而代之的是全民调戏“Ta”。
“Ta是”所使用的图像内容识别技术钓网搜索很早就获得并应用了,但却没有完全对外开放。之前他们对外提供的图片搜索服务采用的是基于图像文件特征值的第一代技术,只能识别同一图像不同尺寸的衍生图片,以及大部分内容相似的图片,并没有实装图像内容识别技术。
反而是内容识别技术被他们用做内容过滤引擎,封杀恶意广告、反黄反暴力,能够有效防止搜索结果里面出现国家法律禁止出现的内容,或者可能损害用户利益的欺诈内容。普通用户对于这项藏于后台的技术没有多少感觉,只是单纯感觉钓网搜索的内容比较干净,没有恶意广告以及很黄很暴力的图片和文字。
虽然一直有批评的声音认为钓网管得太宽,内容过滤太严重,没有提供给用户“原汁原味”的搜索结果让用户去自主选择,失去了工具的中立‘性’。但钓网依旧我行我素,即使被很多中小站点禁止搜索引擎收录也坚持不改。
时间久了,除了在这里找不到‘波’多野结衣新片下载地址的****自觉远离以外,普通用户开始慢慢开始习惯了“钓”按钮的一键直达和“网”按钮的一页‘精’选,当初封杀禁止钓网的网站也开始解禁,允许钓网的搜索机器人程序自动收录他们网站的网页,编制索引。
常规的文件特征值识别技术对于相同或者相似度高的图片具有很好的识别效果,比如使用相机三连拍功能拍摄连续动作,得到变化幅度很小的几张照片,特征值识别技术就能很好的把它们找出来;但是对于这张图片到底是什么内容,这种技术就无能为力了,计算机界一直都在研究内容识别技术,试图识别出不同图像内蕴含的信息,比如识别出同一个人穿着不同衣服,在不同光线环境和背景条件下拍摄的照片。通常使用海量训练法,让识别程序建立一个覆盖几千万甚至几亿张图片的数据库,通过人工辅助纠错的方式维护这个数据库,然后软件再依靠这个数据库去按图索骥。
本章未完,请点击下一页继续阅读! 第2页/共5页