• 23
进军教育搜索,百度搞不定的三件事
统计 阅读时间大约8分钟(2871字)

2013-05-02 进军教育搜索,百度搞不定的三件事

第一个搞不定:课程数据是个黑洞。第二个搞不定:搜索展示页空间不足,在产品层面解决不了教育领域的问题。第三个搞不定:仍然解决不了欺诈广告的问题,反而将承受更多的抱怨。

作者:张迪欧

据报道,搜索引擎巨头百度开始涉足教育培训领域,低调测试一款新品。当用户在搜索栏中输入“雅思培训”时,搜索结果直接显示教学机构名称,其搜索深 度已经接近课程级。这在教育培训行业是个爆炸性新闻值得分析关注,因为此举有可能改变教育行业的推广格局。但是让我们抛开百度的大平台效应 ,仅从教育行业规律出发,以沙盘演绎的方式分析之后,至少目前我认为,百度教育搜索应该有三件大事儿搞不定。

第一个搞不定:课程数据是个黑洞

如果百度此举是为了提升搜索体验,那必定要采取搜索引擎爬虫的方式向全行业抓取数据。否则如果百度的不抓取数据而是要求教育机构自行提交数据的话,此举将只是凤巢推广系统的一部分;这一点咱们暂且不表,留在下文言说。

先谈谈搜索引擎爬取的问题。可以说,所有的行业里,教育培训领域的课程数据整合是最难的,甚至难到了在逻辑上都不能验证通顺的程度。我之前参与过一 个教育类垂直搜索引擎的项目,那一段时间最大的噩梦就是数据问题。之所以最终选择了网络教育,就是因为网络教育的课程数据具有一定程度的可实施性。而百度 这么大的动作不可能只满足于网络教育,他们的指向应该是全行业的线下教育搜索,于是,问题马上就要来了。

首先是数据的规范性极低,无法统一展示。教育行业的本质是服务,依从不同的学科拥有不同的服务特征,不同的机构则有不同的课表标准。就拿课时来 说,A机构说的是课时,B机构谈的是学时,C机构干脆就按小时计费,D机构说一个月是个培训期,E机构也谈课时,但他们的一课时是30分钟……再说班型的 概念,不同机构的班型定义不一样,班型本身千变万化,而且还有同样概念不同名称的班型。仅网络教育的现有机构,网校网抓取的班型就将近300种,更何况线 下教育的庞大集群。再从教育机构来看,有的机构以教师引领,有的机构以教学的组织引领,有的是一对一教学,不同的学校理念不同,课程设置不同,促销方法不 同,甚至基本的名词定义都不同。这个不像实物商品,实物商品属性是基本规范的;也不像饭馆,饭馆是以“店”为单位去组织的。教育搜索引擎如果想做到真正的 服务深度,那么必须以“课”为基本单元(百度目前就是这么做的),这就相当于搜索到饭馆里“菜品”的级别了。在这种极不规范的市场下,根本无法实现这种级 别的抓取。如果百度提出自己的标准,教育机构能否按照百度的指挥棒去执行?如果百度把这些属性强行整合,那么又如何为用户提供准确服务呢?

第二,课程数据难以抓取和更新。假定课程已经规范,但教育领域的网站之千姿百态是大家所公认。即便一家网站,不同学科的页面html规范都不同,更 有甚者,教育机构的课程介绍基本以课表形式展示,这需要人类的智能去读懂。百度爬虫如何能把这么多种不同的HTML,把这么多不同逻辑的表格都爬取拆解整 理入库呢?这是人工智能领域的一大难题,恐怕百度难以解决。即便真的做到了,那么教育机构的课表变化,搜索爬虫的更新频率能跟得上么?当然,百度可以让教 育机构主动提交信息,这个在后文将进行探讨。

第三,数据量之大难以想象,而教育培训是线下服务,对于用户必须就近选取。那么全国有30多个省份,N多城市,地区可以算作一个维度;教育培训的学 科非常多,线下教育学科上千不止,这又是个维度。这两个维度就能衍生数万个区划,每个区划里有N多机构,再加上班型、上课时间等维度,再加上日常更新维 护,这个数据量对百度而言也许不算什么,但数据精准程度就不好说了。

所以如果百度以搜索引擎的方式解决教育领域精准搜索的问题,只能牺牲量而求质,求质就得推广少数机构,推广少数机构就变成了付费推广,成了凤巢系统的一部分,就成了广告行为。反过来,如果求量而牺牲质,那么这种数据黑洞解决不了,质量不高,百度费力不讨好。

第二个搞不定:搜索展示页空间不足,在产品层面解决不了教育领域的问题。

前文中已经铺垫过,即,如果百度采取让教育机构推送课程数据的方式,像传统的竞价系统一样,只有付费的机构才可以推广,那么这种方式与百度的页面如何融合,与用户的阅读习惯如何融合,如何提供充分的展示空间,这将成为UE设计师的噩梦。

众所周知,搜索引擎SEM推广占领的就是搜索结果首页首屏的位置,而这个页面总共才有3到4屏。传统搜索结果里,一条搜索结果的Title和 Description最多有四五行;但在百度教育搜索测试页面展示的,除了每条课程信息占据4行之外,顶部还要挂上筛选器,筛选器就占据了一大块空间。 而且我们已经看到,这4行格式化的课程信息,其作为商业数据,行高一定要高于传统的文本。也就是说,百度教育搜索的搜索结果页与普通搜索结果页相比,要吃 掉大量的高度,会把页面拉长很多,这很考验用户耐心。

如果UE工程师能很好地解决这个问题的话,那么还有个更可怕的问题根本解决不了,这就是展示单元的问题。百度按照测试页面的样子展示课程数据,其基 本的单元就是“课”,而不是“校”。如果旧的搜索方式中,一个搜索结果页列表能最多容纳20个教育机构广告的话,那么新的教育搜索,一个页面最多只能容纳 20条课程。如果用户想多看就只能翻页了…… 如果这样的话,用户不骂街才怪。

用户会不满,教育机构也会骂街:“以前20块钱一个点击,我的机构介绍能上首页首屏第一位,现在20块钱一个点击,我的机构只能上一个课程在上面,还没有自我介绍的地方。”

产品经理肯定会很委屈,那么就把这种教育搜索缩成小块放在顶部吧,也会遇到同样的问题,在小块里展示校还是课?展示“校”,和以前相比意义不大;展 示“课”,每家教育机构的课都足够这个小框里翻页N次,这么多机构如何展示完全如何排序呢?如果竞价的话,如何按“课”向教育机构收费呢?教育机构会满足 么?

总之,我们看到,百度很好地解决了视频、新闻、商品、机票等搜索问题,但进军教育行业恐怕不会如此一帆风顺。教育培训行业是个非常特殊的领域,数据 的特殊性造成课程商品很难统一搜索统一展示。这个问题不解决,不仅无法满足公众用户的搜索需求,而且也会遭到教育机构的不满,因为大机构即便砸钱占版面恐 怕都难以满意,而小机构的生存空间会被大量吞噬。

第三个搞不定:仍然解决不了欺诈广告的问题,反而将承受更多的抱怨。

在医药行业的广告中,百度最近比较闹心,360主要抓住了医药欺诈广告的问题来说事儿。不得不承认,教育行业也存在同样的现象,良莠不齐的教育培训 机构同样大量存在。而且相对医药领域,教育培养行业的甄别难度更大。因为国家对医疗药品机构的审批甚严,搜索引擎只需认证他们的资质即可;而教育机构的筹 建较为容易,入行门槛低,几个老师注册个公司就能办个培训班,所以即便小型教育机构能够提交资质,也难以把握教学质量。教育机构的质量认定主要以口碑为 主,这有点类似餐饮企业。所以,百度的教育搜索其实根本解决不了这样的问题,如果再加上点评内容,那就不是百度,而是一个新网站了。

解决不了老的问题,但会带来新的问题。如果百度提高教育机构的准入门槛或者成本门槛,那势必会侵蚀中小机构的生存空间。而百度不可能只为新东方、新 航道这样的大机构服务,如果百度降低了推广的准入门槛,那将很容易引火上身。因为精准的教育搜索页面会提升用户的期望值,用户的期望值往往含混的,会把搜 索质量和机构服务质量混同在一起,用户会认为,百度既然推荐了某某学校的某课程,而且都到了课程的精度了,那么这个课程肯定是靠谱的。百度通过教育搜索这 种直达课程的方式,无形中给教育机构提供了背书,一旦出现教育投诉,公众的抱怨必将集中在百度身上。

以上是百度以这种方式尝试教育搜索时难以解决的三大问题,当然,百度作为流量巨头和资金巨头,肯定会有不少高人从中谋划,因此也许内部已经解决了这 些问题,只是没有展示出来而已。这些问题如果能够解决,将为国内教育培训领域带来一次革命性的变化,否则百度还不如自己另做或收购一家教育中间页网站更为 安全妥帖。

来源:创事记

1、猎云网原创文章未经授权转载必究,如需转载请联系官方微信号进行授权。
2、转载时须在文章头部明确注明出处、保留官方微信、作者和原文超链接。如转自猎云网(微信号:lieyunjingxuan
)字样。
3、猎云网报道中所涉及的融资金额均由创业公司提供,仅供参考,猎云网不对真实性背书。
4、联系猎云,请加微信号:jinjilei
相关阅读
推荐阅读
{{item.author_display_name}}
{{item.author_display_name}}
{{item.author_user_occu}}
{{item.author_user_sign}}
×