面对《搜索引擎百度已死》你有没有觉得自己减少了使用百度?
知乎用户 Clairad 发表 十五年前: 搜衣服,上百度,搜家电,上百度,搜动画,上百度,搜知识,上百度,搜视频,上百度,搜八卦,上百度,搜音乐,上百度…… 现在: 搜衣服,上淘宝,搜家电,上京东,搜动画,上 B 站,搜知识,上知乎,搜视 …
很多答案是从使用上讲的,我加两个技术方面的。
另外,除了搜索,Google 在深度学习和机器人方面也是全球领先的,尤其是后者。尽管百度也有深度学习研究院,但在这两方面跟 Google 比起来完全是空白。
事实上,让百度来和谷歌比是很不公平的,搜索只是 Google 的一个部门,但却是百度一整个公司。Google 的竞争对手是 Apple、Amazon、Facebook 和 Microsoft,百度的竞争对手是 360、搜狗。Google 没了搜索,还有 Chrome、Android、Youtube,百度没了搜索,那就什么都没有了。
[1] Exclusive: Inside Google Spanner, the Largest Single Database on Earth
仅从搜索结果质量的角度做一个对比。
百度与 http://Google.cn 的眼球跟踪(Eye Tracking)对比图(07 年,来源:Chinese Eye Tracking Study: Baidu Vs Google ):
http://Google.cn 的结果体现了较好的「黄金三角」特征,很可能是因为用户在前几个搜索结果中就找到了要找的链接。而百度的结果较分散,很可能是因为用户不满意前几个搜索结果,继续向下浏览。
看到有说百度在国内好用的,不能忍了。
事例 1:
有朋友跟我提到一款简称为 SL 的游戏,我想大致了解一下,但我连这游戏是什么都不知道。于是。
好了,这样毫无结果的翻了几页,我知道败给百度了。换个引擎吧。
第一页,第三条。我知道找到想要的了。
不服?
换成雅虎
你可以扯出一堆百度搜不出的原因,但我也可以说,不管 BING,YAHOO 还是 GOOGLE,我想要的结果都在第一页上。
其中 BING 和 YAHOO 还没有被墙。
事件二:
刚刚从朋友圈里看到这个:
委内瑞拉反对派似乎要在 7 月 16 号举行公投,热乎的新闻,就刚刚。看我电脑时间和委内瑞拉时间:
新闻时间:
完全热乎的新闻啊!
看看各大搜索引擎的表现吧:
百度完全不知所云,全部是去年的新闻。
必应第一条是新华网一个月前的新闻。
雅虎和必应完全一样。
GOOGLE 表现也不怎么样
后加上 7 月 16 号关键词,仍然如此。看来国内目前还没有 “通稿”,因此没有简体中文的新闻。
那咱们看看英文吧。
讲真,搜英文实时新闻,似乎是有点欺负百度了。
GOOGLE,轻松命中。
必应,轻松命中。
雅虎,轻松命中。
百度:你在说啥?委内瑞拉 7 月 16?你是在说 FIFA 吗?你是在说 2016 年吧?等下,你想说啥?
事例三:
我从友人那边听说了一样赛事,信息支离破碎,大概能确定的只有以下三样:
1、和速可达车队似乎有点关联,但不确定关联是什么
2、这个赛事有 250CC 组
3、报名费是 600 元
除以上三样外,连这是什么赛事我都不知道。
好了,找吧。
先找百度
是兄弟联杯吗?
打开看看
并不是,报名费不符。
是现金奖励赛吗?
打开一看,原来说的也是兄弟联杯。不对。
第一页就这么过去了。
好吧,试试必应:
我还要说什么呢?
二次确认。
不用多说了,毫无悬念。
老实说,只要搜到北方超联,基本上就没问题了,你用任何一个搜索引擎,我估计都能二次确认。关键是首次命中的问题,为什么百度第一页就没有北方超联呢?
不服是吗?
换雅虎
第一页第一条
换 GOOGLE
GOOGLE 第一页。
服不服?
本人 2011-2013 在谷歌工作,所以这方面的想法可能有些过于主观或偏见,请见谅。
我在谷歌做的是地图和街景视图有关的,当时主要的项目是 google art project,实现世界各地几百个博物馆和历史景点-包括美国白宫-的屋内 3D 效果。让全世界人在家里通过屏幕可以身临其境感受到。但我对搜索方面也很感兴趣。
在谷歌,我们能看到任何部门的源代码,除了 Google X 以外(严重保密的项目)。
可以和你们讲一个比较有趣的:谷歌普通搜索跟谷歌‘黄色’搜索是两个分开的项目。
好吧,说百度:曾经有两个机会去百度面试,都被我拒绝了。由于两个朋友在百度工作,感觉对不起他们,所以心里一直很纠结这件事。
------
最近几天很多人关注到魏则西事件,现在也是英国电视台 BBC 有关中国的头条新闻了。通过知乎了解到更多信息了,越来越生气。
之前我在知乎写过,“爸爸是医生。我小的时候就发现他对病人很细心和善良。无论什么问题都会从科学原理解释某几种药的区别,也会很认真去听那些心理问题的人。每次区内几个人死亡,他回家都是难受的不得了。” 我本来以为,救死扶伤是医生最起码的。
再回来说这个无良医院的事情。想提醒大家知道:这件恶事很多人早在两年前就已经知道了。
下面是某人 2014 年写给吴恩达的公开信。吴恩达是英国一位世界级人工智能专家,之前看了他在斯坦福讲的机器学习在线课程。对我来说,他永远是大偶像之一。他离开谷歌去百度,我一直在关注;一方面很惊讶,另一方面觉得肯定对中国网络的发展有很大贡献,所以有些激动。但是当时看到了这封信以后,确实觉醒到世界的黑暗。
大致翻译:假药和假医院这工业的利润;大约 75% 进到百度集团手里。百度为了这个收入;伤害到了许多人的生命。希望吴先生考虑一下别去帮助这家公司。
所以呢,虽然情况暴露这么早,也许有人到今天才能明白,多少人已经受害了。很可惜。
------
为了回答问题;谷歌与百度是否一个量级的? 选择另外一种角度。如何比较谷歌跟百度。
谷歌:
除了中国的 6 亿网民以外,世界上还有 27 亿其他国家的网民。
这 27 亿里面有 80%-90% 的人使用谷歌来搜索。
27 亿 × 85% = 22 亿人在用谷歌。
谷歌在接近 200 个国家都是最大的搜索引擎。支持 100 多门语言。
15 亿多人在用谷歌安卓(包括中国 80% 的智能手机:百度易,阿里云,小米 OS 的核心都是安卓)
13 亿人在用谷歌浏览器 Chrome(包括中国的 70%,360,搜狗、百度、核心又都包括 chrome)
10 亿人在用 Youtube - 世界最大的视频网站 (平均一天有 40 亿视频浏览人次)
10 亿多人在用谷歌邮箱
谷歌+ - 社交平台,用户也至少有七八亿。
3 亿人在用谷歌云盘 - 质量完胜任何类似的产品,我自己整天都在用。
还有 300 多个项目:谷歌地图、谷歌地球、谷歌操作系统、谷歌翻译、谷歌支付、实在太多。
更别说智能汽车之类的保密东西。给程序员还开发了许多:谷歌云端运算、谷歌应用平台、谷歌分析、等等。
好吧,大家可能有个很关键的疑问:
谷歌到底适不适合中国市场?中文汉字很特别,和英文差距很大,搜索效果会很差吧。怎么可能比国内公司做得好?
1)谷歌的华人天才员工超多。
2)谷歌在中国的香港和台湾地区都是最受欢迎的浏览器; 使用率都在 70% 以上。
3)谷歌使用率在 70% 以下的国家只有四五个,比如朝鲜。而且这些国家的独立搜索网站,包括日本雅虎,几乎都在背后运用谷歌的引擎。
4)连伊朗、印度、越南这些语言和英语差距比较大的国家,都用谷歌搜索。对谷歌来说,语言不算是问题。
从这一些角度去看,这个中国特殊论是没有道理的。语言不同对于谷歌肯定没有问题,只是宣传障碍以及其它问题(本文不讨论政治)。附加一张图片。虽然之前被其他知友分享过,但是我想再解释一下。
再次大致翻译:用中文在谷歌搜索,找到想要的结果的平均时间比百度快一倍。这还不包括百度翻到下一页的频率比谷歌高多少倍。用谷歌,需要翻页找信息是很少发生的事情。
强调一点;上面是 2006 年的研究结果;现在差距还要更大更明显。自己用百度和谷歌搜过太多东西,对比中很容易发现谷歌的进步神速。
个人经历:刚刚在百度里面搜 “英国” 这两个字。结果是几个小公司的旅游广告。更别说旁边的“相关人物”:“普京大哥”、“迪拜王子”、等。没有一个和英国有关好不好?下面的相关地名是:“安南国”、“中华联邦”、等:也跟英国无关。
比较一下:在谷歌里面搜” 英国” 这两个字。直接提供英国的人口、GDP、等相关数据。第一结果是维基百科的英国网址,第二是百度百科的英国网址。这才是正常的结果好不好好
如果要最诚实客观的描述;谷歌的算法是超强的。2001 以来就没人能超过。虽然这个算法最早出自李彦宏的 90 年代的博士论文,但是之后的迅速改进已经让谷歌到达任何公司都敌不过的境界。一年一年的改进谁都能看出来。
(备注:之后查了一下。好像不是博士论文,但他有最早的类似 pagerank 的专利,叫 rankdex。谷歌的创始人在这个基础上制作了自己的 pagerank.)
现在谷歌给我显示的广告和搜索结果完全符合自己的口味和需求(虽然这可能涉及到个人隐私这些问题),但是广告的投放精准度确实没有其它任何公司比得过。打个比方,我在谷歌搜 “什么什么”,跳出来的广告肯定是符合我的习惯的,不可能突然跳出什么莆田系的。
------
现在的问题是这样:
谷歌是一家国际大型公司,可以称霸很久,至少几十年。单个国家的集团是无法直接与他竞争的。
所以呢,中国要考虑经济方面的目标,进行 “贸易保护主义”。
如果让谷歌这样的庞大公司无任何限制地进入到中国市场,会对百度造成很大的竞争压力。优酷和其他公司也会受到很大影响。这些竞争对中国本国的公司发展都很不利。中国当然希望自己的公司能够健康稳定成长,肯定会去保护本国公司的。必须减少他们的竞争困难。(特别是初期几十年,发展任何行业都有这个原理)。
只是中国加入 WTO 以后很多保护的政策和手段不能用了,要想出各种新手段来。
网络方面,中国找到了新手段。
把竞争对手屏蔽了。结果很管用。
百度没有强大竞争对手,一家独大。
但是,垄断巨头慢慢就变得肆无忌惮了。
作为英国人,并没有说中国网络公司太弱的意思。现在阿里巴巴比亚马逊大那么多,可以像谷歌一样到世界平台来做霸主。微信也明显比国外聊天软件 (whatsapp 什么的) 好那么多,在英国越来越受欢迎(现在全家人都在用微信)。只是百度这个真的没有什么实际优势。对这一家公司来说,培养出来也很难。
--------------------------------------
(备注: 所有在评论里讨论到政治原因的,你们是在给答主挖坑吗? 答主不上当,不跳)
(再次声明:不讨论政治,我们还是好朋友)
2014.06.23:不知為什麼這個答案下突然多了很多讚和評論,來補充信息答謝觀眾。 關於繁體字問題,我是廣東人,看香港電視長大,簡繁體對我閱讀沒有什麼影響,在我眼裡更無高下之別,我用繁體字寫這篇回答的唯一原因就是當時輸入法的狀態是繁體…… 為保持一致正文補充依然為繁體,盼見諒。
前百度員工,現 Google 員工,在兩個公司做的都不是搜索相關項目。
先一句話回答:在與搜索相關的基礎技術方面,百度距離 Google 仍有很大的差距,但今天是否還存在量級上的差距存疑。
開頭先扯個不相干的領域,蘇聯 1960 年代裝備的 Mig-25 [1] 截擊機,這是世界上第一款能飛雙三(三倍音速,30000 米升限)的戰鬥機。西方世界面對這變態的性能參數驚詫莫名,推斷蘇聯在航空技術上已全面超越西方。直到別連科駕駛 Mig-25 叛逃西方,他們終於有機會接觸真機,才發現它使用的技術其實沒那麼先進,變態的性能指標都是用普通的技術基礎硬幹上去的,飛機非常笨拙以至有「直線戰鬥機」的稱號,可憐的發動機要真飛一次三倍音速落地就得報廢。蘇聯的航空技術並沒有他們想象的這麼逆天。
2009 年我在百度,面對 Google 公開的技術資料和百度的內部系統,我首先想起的就是 Mig-25. 就跟這臺戰機一樣,當時的百度,在中文搜索結果質量的各項指標上,對比 Google 還是有優勢。百度的工程師非常聰明,也非常努力,在某些點上也做得很細很出色,但是在與搜索相關的基礎技術上,百度還是全面落後。百度的搜索質量提高,有很大部分是依靠人工做大量細緻的策略調整硬拉上去的。
用普通技術飛上雙三,Mig-25 本身是個了不起的工程成就。下一代戰機,不管是蘇聯的 Su-27 還是美國的 F-15, 乃至四代機 F-22, 都沒有能飛出雙三來的,但這些下一代戰機在技術水準和整體性能上,無疑遠勝 Mig-25, 這應該能算得上題主所說的量級差異。技術的量級差異不能拿某個特定指標或孤例評估(Mig-25 還曾擊落過 F/A-18 呢),也不能只比較某些技術點上的優劣,而往往是決定於基礎技術水平。
在 2009 年,我可以很肯定地說百度搜索相關的基礎技術對比 Google 有量級差距。據我了解,這些年百度在基礎技術方面進步很快,當然同時 Google 也在快速進步。它們在今天是否有量級的差異,我不確定。
下面列幾個重要的而且公開資料較多的基礎技術:
機群管理的技術水平決定你能擁有和有效使用多少硬件資源,大規模計算與存儲決定你能在這些硬件上做多大規模的事情 —— 而最後,搜索引擎本身就是一套大規模機器學習系統。
在純技術之外,我想特別提一點極大影響技術進步,而至少在 2009 年百度與 Google 差距巨大的因素:普通工程師所能使用的工具水平。我在 Google 感覺最爽的事情是我可以很容易獲得大量的計算資源,做以前無法想象的大規模數據分析。要驗證一個想法,我可以基於一整天的搜索記錄做分析,只需幾分鐘就能得到結果(參見 [3]),進行調整和下一步分析;而如果沒有這套基礎軟件和可以隨意使用的硬件資源,我可能得等一整天才能有結果,或者只能分析小規模的抽樣數據。在我自己的知識和技術水平不變的前提下,Google 這套系統極大地提高了我的工作效率,讓我能做到以前完全無法想象的事情。
我覺得作為一個技術人員,黑或者捧哪個公司毫無意義,技術的事情很直接的,身在哪個公司都無法影響基本判斷。還在百度的時候,我就經常想,Mig-25 的故事是個很好的警示,人很容易為類似「雙三」這樣的成就沾沾自喜,而對實打實的基礎技術差距視而不見,不圖進步,那前景就相當危險了。幸好據我所知的情況,百度可沒有這麼不爭氣。
2014.06.23: 補充一個實際例子來說明不同技術條件下兩個公司做事思路的區別。
評論中有朋友提到百度的分詞技術,這確實是「百度更懂中文」的一個集中體現。百度當年做分詞的時候很可能是這樣的:先從一個人工編輯好的字典開始,用這個字典跑一些網頁,觀察分析裡面的 bad case —— 可能是分詞過細,或者是中文人名沒分出來,然後就嘗試根據中文語法規律加入規則或添加詞表解決這些 bad case, 如此往復,直到有滿意的結果。上線應用,發現有新的 bad case 就再研究加規則,當然也有自動流程發現和確認如「人艱不拆」之類的新詞。
Google 做分詞的話就是把問題看成一個概率問題:如果中文網頁中哪些字經常一起出現,那麼它們很有可能就是一個詞。看哪些詞後面會跟的地得,的地得後面有常跟哪些詞,語法結構也就出來了。(具體的模型參見吳軍《數學之美》)。解題思路就是把所有抓到的中文網頁往 MapReduce 裡一丟,參數算出來就好了。評估分詞質量的方法也很簡單,就拿新模型放到網頁檢索的模型裡,做個實驗看質量有沒提升就行。這套方法結果之好,基本把中文分詞做成了一個沒有多少懸念的簡單問題,而且基本不需要中文語言專家的參與(自然也沒有誰更懂中文的問題)。同時這也就是 Google 做 Translate 的思路。這裡面基本方法其實非常簡單,沒什麼祕密可言,但是你得先有這麼多的網頁數據,還得有大機群,有分佈計算框架,還有可復用的模型……
我認為在技術受限的條件下,人工微調優化結果是一個恰當的產品思路,但這個產品思路會與技術發展路線相互影響。對於長尾頭部的一千個熱詞,完全可以用人工編輯的方法做出非常好的結果,而短期內改進通用的機器模型達到人工編輯的效果幾乎不可能。這時候,人工調整可能會受鼓勵,而通用模型的技術改進可能就得不到足夠的重視 —— 雖然即使以中國的人力成本,對所有搜索結果人工調優也絕無可能,但能搞定長尾頭部也不錯了不是?Google 的主流技術思路則是骨子裡不相信人工調整,什麼事情都非得弄出個自動通用可擴展的模型來不可,這種思路可能一開始在那一千個熱詞上怎麼都比不過勤勞接地氣的編輯,但通過積累數據調整模型,假以時日,整體結果質量就會顯著提升 —— 我就是這麼看 2009 年時 Google 搜索質量給我們的壓力的。這種思路在具體的產品運營上不一定對,不是人人都有 Google 的資源來花時間做通用技術,但 Google 確實就在這種「技術碾壓一切」的(錯誤?)道路上越走越快。
[1] Mikoyan-Gurevich MiG-25
[2] The Datacenter as a Computer: An Introduction to the Design of Warehouse-Scale Machines, Second Edition
[3] Dremel: Interactive Analysis of Web-Scale Datasets
就搜索 “技术” 而言。
百度的工程师肯定离不开谷歌。
谷歌的工程师应该从不用百度。
=====
几年前抖的机灵,陆陆续续的得了一些赞。
=====
不过,不过,,当初为了黑而黑的我,现在来拿百度工资了。
=====
我还是不用百度搜索 “技术”
=====
语言因素很重要。。。
=====
我就上个图
我是来反对
大大 及其它部分网友答案的,如果觉得有道理请点赞帮忙顶起来,谢谢!:(提醒,多图长文)
一.
在搜索江湖的早期历史中,李彦宏的技术创新领先于谷歌 1. 我的理解,题主问题的语境是当下,就算是 “曾经领先” 并不能说明什么。
2. 到底是不是曾经领先呢?
_在搜索引擎的早期发展史中,李彦宏 + 威廉张,无疑是技术的领先者。在 1998 年的布里斯班世界互联网大会上,李彦宏是主讲台上的技术布道者,而谷歌的两位创始人仍是坐在台下聆听的学生而已。
_
这一说法是有一些争议的,曾经有网友置疑过,我摘录如下:(完整链接:东拉西扯:超链分析和 PageRank 的专利问题)
以前我曾在很多地方看到,李彦宏说上世纪 90 年代中期,他在澳大利亚讲超链分析,有两个斯坦福的学生坐在台下,后来这两个学生做出了 Google。不过我一直没太搞清楚这事儿的先后次序,到底是李彦宏的启蒙在前,还是 Page 和 Brin 的实践在前。终于梁冬的书中找到了答案,这个会议的时间是 1998 年 4 月,地点是澳大利亚的布里斯班。如果没有搞错,这应该就是第七届国际 WWW 大会。不过这时候,Google 的前身 BackRub 已经在斯坦福大学的网络上运行了两年多。
我在这次大会的网站上,找到了一些更有趣的信息。Larry Page 和 Sergey Brin 著名的论文,《一种大规模超文本 Web 搜索引擎的分析》就是在这次大会上提交的,作为对 PageRank 技术最早的公开阐述,这个论文后来被大量引用。
不过,在这个网站上,我没能找到有关 Robin Li 的任何信息,包含 Page 和 Brin 的网页,倒是可以找到一些。
还有我找到的资料:
小结:从专利提交时间上来说超链接分析技术专利比 Page****Rank 要早,**
说的似乎在理。但是,离开了时间谈强弱是没有意义的!打个比方,我会上知乎码字,孔圣人不会,我比圣人牛逼?非也。要比技术****的话,要么比同一时间的,要么比同一发展阶段的,而这两个,百度并不占优。**
**另:
这段话有点问题:**
同一年,谷歌推出自己的搜索引擎,以精准广告为商业模式,成功解决了持续成长的问题,在搜索江湖的较量中熬到了最后。谷歌今日引以为荣的网页评级机制 pagerank 技术,直到 2001 年才被授予美国专利,比李彦宏的 1996 年申请的超链分析专利技术晚了 5 年。
二.
百度从一开始就和谷歌走上了不同的发展方向这段话我基本同意,但是这也并不能说明百度的技术比 Google 强,Google 并非不能而是不愿提供 mp3 搜索之类的东西,要知道这个是侵权的啊。——金钱还是底线?Google 选择了后者,多么有节操啊!而且,为了跟百度竞争,Google 甚至自己购买了一些音乐的版权,并把它们放在网上供网友下载,正版高质量音乐啊!
三.
2009 年后,百度推出框计算,2013 年推出轻应用,在一站式生活搜索方面,是超过了谷歌的。
谷歌 2006 就开始做 OneBox(链接 blogspot.com 的页面),而百度的框计算是 2009 年推出的(链接:框计算)。时间上 Google 比百度早了三年,技术上,不是专业人员,无法具体分析。
-———-UPDATE————
君临大大更新了,再驳之:
追求网页精度的就是技术,追求更好答案内容匹配的就不是技术?想起了当年联想乐应用的传言,用客服 MM 们根据用户提交的录音手工转换成文字内容然后反馈到手机客户端,这个比 Siri 的技术更强?(未经证实,只是举例)
谷歌在李开复时代就打不过百度,被墙的也只是一些敏感词内容,难道你天天就只搜索敏感词啊,市场上百分之 99% 的搜索需求都跟政治无关的好不好。看来君临大大很少用 Google 啊!!!!当年搜个 “胡萝卜” 都会被墙啊!!!!只因为那个 “胡” 跟圣上冲突了啊!!!!一墙就是 10 分钟不能用啊!!!!
手机时代的划分。
一代手机:模拟技术
二代手机:数字技术
三代手机:智能技术君临大大按这个逻辑得出百度跟 Google 是一个量级的结论,于是我得出了另一个结论:我深圳大山寨厂跟苹果是一个量级的,你看,不都是智能手机么?
_百度所发展的框计算技术,在我看来,恰恰是更适合搜索引擎行业的 “智能” 发展趋势的。
_我倒觉得 Google Now 才是最适合搜索引擎行业的 “智能” 发展趋势,你百度还要个框,人家 Google 直接帮你把事儿安排好了。
update:
君临大大再次更新,再驳:
很多人认为百度的搜索答案都只是人工干预的结果,没有技术含量,我感到很遗憾。
或许早年是如此,但是现在应该已经有很大的改进了。
我举个例子。
前面的谢霆锋的身高的问题,为什么百度能够给我答案,谷歌给不了呢?
百度该不会无聊到这么细节的问题都专门去优化一下答案吧,当然不是了,这些答案都是依托于百科里用户自行编写的答案,百度不过是把他们的知识有机的整合起来,通过程序的设计,巧妙的呈现到你的面前。用君临的例子,同的样问题,张柏芝儿子的爸爸,有结果,把 “爸爸” 换成 “爷爷” 就没结果了:
换成 “谢霆锋的爸爸**” 又有结果了,整合乎?人工乎?**
-————————– 上面是反对,下面是看法,中间是分割线 ————————–
到底谁技术更强呢,我们来模拟一下日常使用场景:
1. 娱乐类的,最喜欢李安了,想了解一下:
Google 右边给出了简介,他的作品,其它用户的搜索推荐。简单的了解,扫一眼简介,想了解他的作品,点击他的电影后是这样的:
又漂亮,又利于获取信息,有木有?正文链接,除了第二个都是相关新闻外,Google 给出前三的答案分别为:维基、豆瓣、Mtime,百度的是:百度百科、知乎、百度贴吧,你觉得哪个消息源更可靠?
小结:
一般人在搜索李安时想得到什么样的答案?作为一位名导演,通常人们感兴趣的是:1. 他本人的一些情况,2. 他的作品,3. 再延伸到他作品大概是什么样的。
看看 Google 的,简介,看右边,作品,在右边下面的位置,详细情况:维基、豆瓣、Mtime。在国内,电影类的豆瓣和 Mtime 应该是相关度最高,资料最全面,质量最好的的网站吧?维基百科就不用多说了,准确、公正,比百度百科只强不差。想了解作品的用户呢? 直接点作品,然后在页面上面出现了他所有的作品,你可以在一个页面内浏览它,又全面又方便。
百度呢?光看搜索结果页,并不能了解他有哪些作品。再看具体结果:百度百科、相关新闻、知乎、百度贴吧、电影网、维基、百度视频、百度图片、豆瓣、追梦人李安(央视)、CNTV、百度知道,十二个结果,有五个是百度自家的,而且这样的排序,我想不出来背后的逻辑。
下面有知友说『如果有百度百科作为这类承载为何不可』,事实上,很多 Google 的搜索的结果会指向百度的产品(百科、知道、贴吧),比方说同样作为娱乐人物的周杰伦,Google 结果第二个就是百度贴吧(除去新闻那一个),而 Mtime 和豆瓣放到第二页去了,说明对于想了解周杰伦的用户而言,贴吧的权重更高,这也更符合事实,不是么?
**所以,我的结论是在这方面 Google 做得更好。
**
2. 有道题不会算,搜一下:
两个都能达到目的,不过,Google 的要漂亮一些,不是吗?
小结:
**功能都没问题。百度的计算器默认未展开,想再次计算不太方便,界面采用类似 IOS6 的拟物化设计,跟整体风格不太搭配。Google 的计算器默认展开,扁平化设计,风格跟网页统一。
个人更喜欢 Google。
**
3. 再来看汇率:
都能达到目的,不过 Google 给出了汇率波动的折线图。(最好的搜索方法是在两个币种之间敲空格,根本不用打那么一堆的,例:“1 美元 人民币”)
小结:
**两者差不多,Google 给出了汇率波动折线图,稍胜。
**
3. 路线搜索:
百度似乎胜一筹,但是我们再看看具体内容,百度前三结果:携程 (广告推广)、去哪儿(百度旗下)、百度地图,Google 前三:去哪儿、携程、火车票网(火车时间表),在网页最下面显示了 Google 地图。
再换一个短一点行程的:
百度,第一个是去哪儿,第二个是百度地图。Google,第一个是地图,第二个是火车票网(火车时刻表)。
规划行程最好的还是地图吧?,再来比较一下:
Google 默认展开最佳路线,路线相当详细,收费路段用红字标明,而且界面比百度漂亮,有没有?
而且,最最最厉害的是,如果你在用 Google Now,当你在 google 上搜索过行程后,无需任何设置,到了时间,Google Now 会自动提示你,第一次使用的时候,我那个惊喜啊。。。。
小结:
百度是能满足需求的,框内应用质量也非常高,只是我觉得百度有推自家产品之嫌。
再来看 Google,我举了两个例子,一个长途,一个短途,从广州到上海,很少人开车去吧?最常见的交通方式应该是飞机和火车,所以 Google 优先放的是这两个。地图放最下面,说明它的权重不够(哪怕是自家产品),还可以满足部分想驾车的用户。短途,东莞到深圳,驾车的就多了吧?所以 Google 把地图放在第一位了。我觉得这说明 Google 理解了搜索背后的那个用户。而且如果你开通了 Google Now 的话,那百度跟 Google 的差距就大了。
个人觉得两个都不错,相对而言,百度可能更适合国人的味口,毕竟,对于旅行来说,去哪儿和携程是个不错的选择。但是我觉得谷歌更理解搜索背后的思维。所以技术上来说还是 Google 更胜一筹,如果加上 Google Now 的话,Google 可以直接甩掉百度了。(国内没开通 Google Now,不过可以通过某些方法达到,需要的请自行 Google^_^****)
4. 刚需,看片:
百度是生怕你找不到,Google 是生怕你找到了,百度让人 “心神不宁”,Google 让人火冒三丈。当然对于成人而言,这些都没问题,但是,如果是你未成年的子女在用呢?Google 默认开启了安全搜索,在你搜索某些内容时会过滤。
小结:
看片要种还是找度娘吧。
5. 图片搜索:
印象中这个功能是 Google 先推出的
这个功能,其实两都都不算太强。
百度提供了 “文件格式(常见的图片格式都有了)、尺寸、分辨率、是否收费” 四个筛选器。Google 提供了大小(分辨率)、颜色、类型(脸部特写相片、剪贴画、素描画、动画)、时间这四个筛选器。(2014 年 1 月 4 日多了版权这个筛选器)Google 更丰富,百度更符合国人习惯。
以图找图:
印象中这个功能是 Google 先推出的。Google 提供了拖动找图的功能,百度没有。再看结果:
百度识别为周杰伦,Google 识别为魔杰座。(另:一次复制链接找图,百度无结果 <下面的推荐中出现了一堆让人心神不灵的图片>,Google 准确识别,本想截图的,忘记链接了未能再现。)
**
小结:**
百度更符合国人习惯,经常找素材的设计师应该会喜欢。Google 提供了颜色分类,人个觉得更有技术含量一点。以图找图,Google 更方便,结果也比百度稍准(这里可能会有不同看法,显示周杰伦好还是周杰伦的魔杰座好,个人偏向后者)。
还有一些其它的,我就不一一比较了,再分享一些 Google 实用技巧,这些掌握了才算是真正的会用 Google 啊:(转自知乎,链接:一周看点 1. 学会 Google 用法,走遍天下都不怕)
崔凯,搬砖工。求工作!
搜索引擎命令大全!
1、双引号
把搜索词放在双引号中,代表完全匹配搜索,也就是说搜索结果返回的页面包含双引号中出现的所有的词,连顺序也必须完全匹配。bd 和 Google 都支持这个指令。例如搜索: “seo 方法图片”
2、减号
减号代表搜索不包含减号后面的词的页面。使用这个指令时减号前面必须是空格,减号后面没有空格,紧跟着需要排除的词。Google 和 bd 都支持这个指令。
例如:搜索 - 引擎
返回的则是包含 “搜索” 这个词,却不包含 “引擎” 这个词的结果
3、星号
星号 * 是常用的通配符,也可以用在搜索中。百度不支持 * 号搜索指令。
比如在 Google 中搜索:搜索 * 擎
其中的 * 号代表任何文字。返回的结果就不仅包含 “搜索引擎”,还包含了“搜索收擎”,“搜索巨擎” 等内容。
4、inurl
inurl: 指令用于搜索查询词出现在 url 中的页面。bd 和 Google 都支持 inurl 指令。inurl 指令支持中文和英文。
比如搜索:inurl: 搜索引擎优化
返回的结果都是网址 url 中包含 “搜索引擎优化” 的页面。由于关键词出现在 url 中对排名有一定影响,使用 inurl: 搜索可以更准确地找到竞争对手。
5、inanchor
inanchor: 指令返回的结果是导入链接锚文字中包含搜索词的页面。百度不支持 inanchor。
比如在 Google 搜索 :inanchor: 点击这里
返回的结果页面本身并不一定包含 “点击这里” 这四个字,而是指向这些页面的链接锚文字中出现了 “点击这里” 这四个字。
可以用来找到某个关键词的竞争对收,而且这些竞争对手往往是做过 SEO 的。研究竞争对手页面有哪些外部链接,就可以找到很多链接资源。
6、intitle
intitle: 指令返回的是页面 title 中包含关键词的页面。Google 和 bd 都支持 intitle 指令。
使用 intitle 指令找到的文件是更准确的竞争页面。如果关键词只出现在页面可见文字中,而没有出现在 title 中,大部分情况是并没有针对关键词进行优化,所以也不是有力的竞争对手。
7、allintitle
allintitle: 搜索返回的是页面标题中包含多组关键词的文件。
例如 :allintitle:SEO 搜索引擎优化
就相当于:intitle:SEO intitle: 搜索引擎优化
返回的是标题中中既包含 “SEO”,也包含“搜索引擎优化” 的页面
8、allinurl
与 allintitle: 类似。
allinurl:SEO 搜索引擎优化
就相当于 :inurl:SEO inurl: 搜索引擎优化
9、filetype
用于搜索特定文件格式。Google 和 bd 都支持 filetype 指令。
比如搜索 filetype:pdf SEO
返回的就是包含 SEO 这个关键词的所有 pdf 文件。
10、site
site: 是 SEO 最熟悉的高级搜索指令,用来搜索某个域名下的所有文件。
11、linkdomain
linkdomain: 指令只适用于雅虎,返回的是某个域名的反向链接。雅虎的反向链接数据还比较准
确,是 SEO 人员研究竞争对手外部链接情况的重要工具之一。
比如搜索
linkdomain:http://cnseotool.com -site:http://cnseotool.com
得到的就是点石网站的外部链接,因为 - site:http://cnseotool.com 已经排除了点石本身的页面,也就是内部
链接,剩下的就都是外部链接了。
12、related
related: 指令只适用于 Google,返回的结果是与某个网站有关联的页面。比如搜索
related:http://cnseotool.com
我们就可以得到 Google 所认为的与点石网站有关联的其他页面。 这种关联到底指的是什么,Google 并没有明确说明,一般认为指的是有共同外部链接的网站。
上面介绍的这几个高级搜索指令,单独使用可以找到不少资源,或者可以更精确地定位竞争对
手。把这些指令混合起来使用则更强大。
inurl:gov 减肥
返回的就是 url 中包含 gov,页面中有 “减肥” 这个词的页面。很多 SEO 人员认为 GVM 和学校网
站有比较高的权重,找到相关的 GVM 和学校网站,就找到了最好的链接资源。
下面这个指令返回的是来自. 中国教育和科研计算机网 CERNET,也就是学校域名上的包含 “交换链接” 这个词的页面:
inurl:. 中国教育和科研计算机网 CERNET 交换链接
从中 SEO 人员可以找到愿意交换链接的学校网站。
或者使用一个更精确的搜索:
inurl:. 中国教育和科研计算机网 CERNET intitle: 交换链接
返回的则是来自中国教育和科研计算机网 CERNET 域名,标题中包含 “交换链接” 这四个字的页面,返回的结果大部分应
该是愿意交换链接的学校网站。
再比如下面这个指令:
inurl: 中国教育和科研计算机网 CERNET*register
返回的结果是在. 中国教育和科研计算机网 CERNET 域名上,url 中包含 “forum” 以及 “register” 这两个单词的页面,也就是
学校论坛的注册页面。找到这些论坛,也就找到了能在高权重域名上留下签名的很多机会。
下面这个指令返回的是页面与减肥有关,url 中包含 links 这个单词的页面:
减肥 inurl:links
很多站长把交换链接页面命名为 links.html 等,所以这个指令返回的就是与减肥主题相关的交换
链接页面。
下面这个指令返回的是 url 中包含 http://gov.cn 以及 links 的页面,也就是 GVM 域名上的交换链接页面:
allinurl:gov.cn+links
最后一个例子,在雅虎搜索这个指令:
linkdomain:http://cnseotool.com -linkdomain:http://cnseotool.com
返回的是链接到点石网站,却没有链接到我的博客的网站。使用这个指令可以找到很多连向你
的竞争对手或其他同行业网站,却没连向你的网站的页面,这些网站是最好的链接资源。
高级搜索指令组合使用变化多端,功能强大。一个合格的 SEO 必须熟练掌握这几个常用指令的
意义及组合方法,才能更有效率地找到更多竞争对手和链接资源。
找外链的时候你可以用这几种命令组合,例如 site:.com inurl:blog “post a comment” -”comments closed” -”you must be logged in” “输入你的关键词 “,
site:.com 是 指, 只显示. com 的网站。 如果你想要 org 的链接,就换成 site:.org,inurl:blog 是指博客。
“post a comment” -”comments closed” -”you must be logged in” 是指, “能够写评论的” 减去 “ 关闭评论的” 再减去 “ 必须要登录才能写评论的”。
总结:
**搜索技术上,我觉得 Google 是领先的,如果你肯花点时间学习一下,Google 能给你的肯定会更多更好。(**搜索跟使用的关键词有关,或者说跟用户有关,如果你找不到你想要的结果,请考虑一下是不是关键词使用不当?
百度是够用的,由于人工调整和资源整合的缘故,它可能在某些方面更符合国内用户习惯(比方说看片这个宅男刚需,还有快递查询之类的合作)。
Google 的结果更公正,百度明显偏向自家的产品,但因为这些产品(百度知道、贴吧、音乐等)占据了很大的市场份额,跟国内公司的合作也比较深入,导致就算这样结果也还算理想,造成 “百度更懂中文” 的假像(这句话应该改成 “百度更懂中国人” 才对啊)。
搜索只是个工具而已,在某种意义上,够用的就是好的,但是我相信把两者结合起来用才会发挥 “搜索” 的最大威力。
特地搜索到这个问题来回答:
大家一直说百度是搜索英文烂,我没什么感觉,毕竟平时蹩脚的英文也很少用,直到今天,就刚刚。
我想自己做个网站,很简单,就是把今天要做的事情以卡片的形式展现出来,每完成一个就移除掉,用来警示自己的拖延症,顺带也想造福一下公司的好基友。
于是,我苦思冥想了一个非常有逼格的域名:http://todaythings.com。
万网上一搜,没人注册,正和我意。
为了确保万无一失,我把这个词复制到百度确认,结果如下:
很好!
于是我就下单支付了。
不到一分钟,我就在看这个页面了:
结果是:
不能退款!!!很多人肯定还一脸懵逼中,为什么要退款?
因为 ————-
刚才百度的那个词里,TMD 压根就不是 “today” 这个单词!
我屮艸芔茻!
老子英语水平不行,你 TMD 的也给乱翻译!
简直气死!
事已至此,话说有没有人需要 http://toadythings.com 这个域名哇,友情赠送了。
翻译过来大概意思是:马屁精的那些事儿~
关于百度,周鸿祎说过一句话,我觉得特别有道理:百度不缺狼性,缺的是人性。
的确如此,无数次惨痛的百度搜索经历让我明白,百度真没人性,娱乐至上,屏蔽网页就不说了,有色成分也不说了,搜索不准确让人头痛无比也不说了,百度地图界面杂质太多也不说了,强行安装软件什么也不说了…… 我对百度已经无话可说。我现在只有在谷歌用不了的时候才用百度。百度不缺竞争力,他的框计算很厉害,但全都用在明星绯闻上了,什么三围什么私生子,完全在秀下限。当然,也有一些便民功能,我不否认,但看问题要看主要矛盾的主要方面。
真正让人郁闷的是:百度其实可以做的更好,有能力做好,这一点我们清楚百度也清楚,但是他不做,因为做了收益也不会增加,至少短期内不会盈利。没有人性的百度,在中国绝对垄断,他现在在过一种 “过一把瘾就死” 的生活,试想一下,如果谷歌再入中国,百度拿什么来竞争?而你那些百度影音、百度支付之类拾人牙慧的玩意,能让你保持今日之风光吗?
当年卖山寨机的时候,我也说 Nokia 和我们是一个量级的,都有一样多的按键和屏幕,我们有些地方,nokia 都不如,比如我们的灯多,声音大。。。。
百度一直是站内搜索好么
楼上某些人的截图很不负责任啊,你们比较应该是用它们最擅长的语言好不好?应该是百度的中文搜索比较谷歌的英文搜索,我现在举几个例子。你不要用香港谷歌,用美国谷歌试试。而且语法尽量符合美国人习惯
首先是冬奥会的
湖人队,这个看各位排版喜好了
然后是油价换算,这个百度根本不行,然后看看美帝的油价
然后是汇率
地理,以日落时间为例
位置搜索
行程,都有飞机,都很贴心的说
城市中餐馆搜索
人物搜索,以兵库北为例,谷歌显然内容更丰富,排版更漂亮
公司搜索,谷歌提供了当日股市行情
知识覆盖与理解:
这个真是中国特色
然后是航班查询
5s 发布日期
一款汽车查询
动漫查询,百度给出了观看链接,非常人性化
世界杯相关,显然百度和谷歌各有偏好
空气质量指数,美国空气太好了,没人用的原因吗?
问两地多远的问题
生活查询,比如可口可乐的热卡
科学计算
外语翻译,百度还是很多语言没有收录,貌似只有几种,举个西班牙语的例子
简单的单位换算
看了这么多图,我认为,其实两家各有所长楼上各种喷子还是休息吧,我用谷歌只是觉得它更加美观而已。其实什么搜索技术最直接的表现不是在这些日常应用上面么?那些高精深的东西又有多少人会去用呢?鉴于国内网站含水量太高,我个人还是推荐谷歌的,毕竟在美国享受到了各种便利。
2016 年 5 月 11 号中午,在 QQ 群看到这百度的截图,我以为是段子,小伙伴们纷纷表示瞎了狗眼。
超过 24 小时后的 2016 年 5 月 12 号傍晚 7 点半,百度的这个老问题又刷了次 timeline,我就饶有兴趣的又查了下这个词,没想到是真的。
魏则西的推广门才过去几天,卖血友病吧的事血仍未冷,这一瞬间,我心里忍不住又好气又笑地骂一声:这破公司不死真是没天理了。尽管我知道他现在如果死了,问题更大。
先说下 google
有人说,6 年前 google 退出中国是因为涉黄。不过今天我们看到的 google 公司旗下产品包括
自动驾驶汽车
google 眼镜
阿法狗
还有各种牛逼、但相对小型的产品(例如 chrome,google 地球地图、google 人体、Google Art Project、还有类似这个:一个玩得停不下来的 Google 神器:Ngram - Something about Everything - 知乎专栏)。
上述产品或多或少的以 google 自身的搜索、分析技术为基础。
例如 alphago 的原理(图片来源于网络)
此外非 google 所创,但被 google 收购的产品,还包括你手机上可能正在用的安卓系统。
全世界没瞎或没装瞎的人都看得见:google 的大小产品在某种程度上,在推动着人类科技的进步,改善着人类的生活。更有不少产品走在人类科技的最前沿。
=============================================================
再来看看百度。
论搜索技术,用过百度和 google 的人都懂。你一本正经的为工作搜寻图片时,正经的图搜不到,不时总会有些完全出乎你意料之外的惊喜,例如前面发的那张 “羡慕” 的图。不知道谁才在涉黄。以及除了瞎狗眼外,旁边一堆不知所谓“相关链接”。还有例如下面,我就不评论道德水平,扣下题评论“搜索技术”:
我也挺纳闷的,我要是故意用某些色情关键词去搜相关信息也就罢了,连这些牛头不对马嘴的正经关键词都能搜出和性挂钩的图,百度这搜索技术是满足哪些用户的需求?
搜出来的推广尽可能用肉眼难以识别的接近于 100% 透明的浅灰色框住(魏则西事件后换成了显眼的红色),如果你不慎点了推广里的黑医院——“那可不怪百度没做推广识别,是你眼神不好”。ui 技术也是倾注了百度的对人体生理极限的透彻把握。
其他的,山寨 google 识图的百度识图,经常识别错误搜不出正确目标。
山寨 google 地图的百度地图,出了中国没法用。各位可以随便尝试用百度地图搜下华盛顿、罗马、巴黎。
与技术相关,但无关搜索的,最耳熟能详的:百度全家桶什么的。技术真心强大,用户被流氓之后想卸都卸不干净。开机自动篡改网络浏览器首页为 hao123 的木马软件,卡巴斯基小红伞都捡不出来。
平心而论,百度真正体验好点的产品就只有网盘和百度翻译了,不过和搜索技术没啥关系。
=============================================================
最后说说其他的
就在前几天,知乎上还有专栏文章从道德高度揭 google 的黑,诸如在美国卖非法药广告被人告了被罚款啥的,诸如广告费用在收入占比很高,最后得出结论:google 和百度是一般货色。
google 清理这些广告并被罚款是 09-11 年的旧事。至于广告占比,那是偷换概念,我不管他广告收入占比是 80% 还是 90%,只要广告投放的点合适,别在我使用的时候严重添堵、别害人跑错黑医院,他广告占比 99% 又如何,中央台不也是广告收入占大头?
我们这么一群中国用户,要求很低,眼光也很短浅,只是希望在天这天嚷着 “中国梦” 的 2016 年的中国,有稍微正常点、干净点、少点欺骗性的上网用户体验而已,这应该不算什么吹毛求疵的要求吧?不过这大 V 的专栏文章只字不提我们目前切身相关的用户体验,光去起底别人在美国打官司的旧事和广告占比高,结论是别人作恶多端,这也真是站得高看得远。我才知道,近年来不断推动人类科技、改善着人类生活、搜索体验快捷到位舒适的公司,跟吃人血馒头、想尽办法给用户添堵的公司,居然也能相提并论为 “一般货色”。
那文章一下午刷了接近 3000 赞,比最近魏则西、砍死医生的新闻涨赞都快。当然了,这请大 V 写软文刷赞的钱也未必是来自百度的,还可能是……
清代中前期没有推广或拒绝了当时最先进的西方科技,大概可归结为 3 条原因:
1、对传教士总想着传教的动机怀疑,担心他们包藏西方国家的祸心,会颠覆自己的统治。
2、怕西方的世界观、道德观冲击传统观念,导致人心不稳,康熙就曾表达过类似观点。
3、觉得外国有的,中国也有,没什么了不起的。用不着引进、用不着细究。
2016 年 5 月 12 日,魏则西去世一个月之后。
那些说百度搜索结果不好的人,你们有没有意识到不是因为百度的搜索技术差,而是因为屏蔽技术强。朋友的网站,好几年了,一直搜不到。
不是一个量级。
Google 的准确率真不是盖的,一般不用滚动页面即可看到所需的结果。而百度,排在前面的时常是些不明所以的页面。非中文的搜索就更不用说了。
个人感觉,百度的优势在于对诸如”百度知道 “” 百度贴吧 “之类的信息渠道有更好的掌控。拜中国庞大的网民基数所赐,很多需要搜索的问题都已经有人问过,这样即使用户输入的关键词很” 搜索引擎不友好“,也能通过简单的模型得到比较正确的结果。
举个例子,同样是搜索” 章鱼和八爪鱼是不是一个东西 “(不要吐槽这个查询,这个是我同学刚刚去搜的 orz…),百度的前三条结果是:
而 Google 的前三条结果是:
可以看出,百度只是将用户查询进行了简单的分词、停用词剔除等操作,然后基于出现的字词去查询结果;而 Google 对于查询语句明显有一定语义理解。从中可以管窥两公司的技术差异。
说一个和知乎有关系的,两个小时前看了一个关于足球的答案,有哪些广受球迷恶搞的足球运动员?,看到一半手机没电了,找的时候在足球专题里找没有找到,而题目我当时已经忘了,而知乎关键词好像只能检索题目,答案里头是不检索的,于是我决定百度之,我用的关键词是答案里的一句话:
身为皇马球迷, 我尽量黑得有风格。这是谷歌的结果:
这是百度的:
来晚了,用一个被理科生用烂了的梗【交换群】反映一下百度和谷歌在搜索技术上的本质差别吧
-————————————————————————————————————————————–
-————————————————————————————————————————————–
-———————————————————–
(修改:很多朋友提到了这个回答和搜索技术无关,主要还是体现了 “主要使用群体” 的搜索习惯…… 嗯,我认为你们的说法更准确。本问题下面已经有很多出色且靠谱的回答了,所以我只是想抖一个微小的机灵而已,如果感觉被耍了就请尽情点击没有帮助吧~ 很惭愧,谢谢大家~)
有一次需要对一个二维平面划分有限元网格进行积分,这可愁死我了,我用英文翻译之后用 Google 搜索了一下,结果出来的居然是很权威的一本有限元教科书,并把我的翻译结果在书里面用高亮文本显示了出来,看到这个结果之后我吓了一跳。在百度里面经常看到小学生问某某数学题怎么做,某某爱上了某某不能性勃起,我靠,你说什么量级。
题主问的是技术,那么我就说说技术上的事情吧,因为恰好我毕业论文做的就是搜索引擎:
简单说一下历史:其实两家公司可以算是同时起步的,Google 稍早一些,PageRank 概念是 Google 最早提出来的,百度虽然晚了几年,但百度的那一套东西,最早用的是北大的天网搜索的技术,我记得北大还写了一本书,不过早就绝版了,书里讨论的就是中文搜索的基本思路。
如果讨论技术对比,那么前提是只看中文搜索,因为百度的非中文搜索太烂了,并且收录的非中文网页也实在太少。另外,百度的非中文搜索也不是完全没有,比如这个(百度日语搜索,国内可能打不开):http://www.baidu.jp
搜索引擎的主要技术指标包括:
1、准确度和排序。
2、收录速度。
3、收录网页总规模。
注:这里没有提搜索速度,是以为商业搜索引擎基本上都能在一秒内完成搜索,而一般网页页面打开也需要接近一秒的时间,所以一般来说搜索速度不是重点的技术指标。
然后说说搜索引擎技术的基本原理:
网页搜索引擎跟大多数人的理解不同,不是说用户来了请求就到数亿的网页里搜索结果,这样做太慢了,并且超级计算机做起来都很困难。
举个简单的例子,有以下几个网页:
A 网页内容:中国大学的就业率与高考考试成绩不成正比。
B 网页内容:大学考试很简单。
C 网页内容:高考录取率很高,上了重点高中就等于上了大学。
当搜索引擎收录网页的时候,会拆出网页的关键词,比如:
大学出现在:A/B/C 页面
高考出现在:A/C 页面
考试出现在:A/B 页面
那么当有人搜索 “高考考试” 的时候,只需要求一下两个关键字结果集合的交集(即相同的部分),就可以得到结果了。用数学表示就是:
**{A, C} ∩ {A, B} = {A}
**
所以搜索引擎是在收录网页时就完成了预处理,实际搜索的过程中不是去数亿的页面里去直接搜索。
搜索引擎简单的结构是(只能说简单的说是这样的):
爬虫系统(收录网页)==> 预处理系统(过滤干扰字符)==> 分词系统(建立索引)==> 网页数据库 ==> 用户搜索处理
=================== 罗嗦了半天,现在开始看技术比较 ===================
1、准确度和排序:之前的回答有各种各样的比较,但是这里回答问题的人大多数都是技术行业、互联网行业相关的,普通用户搜索的东西与我们会是一样的吗?看看这里:百度搜索风云榜,看看大多数中国人在关心什么。因为大多数拉丁文字都是自动成词的,但汉字不是。比如下面的这个笑话:
小心地滑可以拆成:小心地 / 滑 和 小心 / 地滑,这个例子不是用来证明 Google 的分词没做好,因为这不是搜索结果,我只是在这里强调一下分词是一件多么麻烦的事情。
**普通用户可能更多的搜索 “从北京南站到首都机场” 而不是 “OSLOADER 符号表” 这些。**我也不否认技术类的东西百度搜的更准确,但中国几亿上网用户有多少是搞技术的?
Google 把 “用户想要的东西” 更多的局限于网页结果上,而百度则是把用户想要的东西直接展示给用户。比如“个税计算器”、“万年历” 这些。肯定有人会说我耍赖,把百度应用 / API 这些东西也算搜索结果,但是我问一句:用户上网搜索就是只为网页吗?用户是要结果。
在中文搜索方面,尤其是分词方面 Google 没有太大的优势,排序方面二者基本相当,但百度把一些关键词做了人为干预,实际上这种干预目前来看还是很成功的。
所以在结果和排序上,中文搜索百度略微占优势。
P.S 看某些评论里有人提到了美剧的搜索,如果名字是英文的,请用 Google,如果名字是中文的,请用百度。
2、收录速度,之前有人回答了百度比 Google 慢,这个我比较认同,大多数情况下 Google 收录的新东西更快。但 Google 有一个问题就是结果太少,虽然用户实际上不会看到几十页以后的结果,但是百度一般能给出将近 100 页的结果,Google 只有十几页左右。另外,突发事件的时候百度人工干预的痕迹很明显,但 Google 则一般都是机器做的,这一点 Google 明显强于百度。
3、网页规模,Google 的总网页规模是百度的 10 倍左右(06 年官方数据,百度 12 亿,Google82 亿),网页规模越大,复杂度的增长不是线性的,并且 Google 搜索的时候,不管是中文还是英文,都是在同一个网页池里搜索的,这里既有中文,也有英文。早期(2005 年左右)的时候我记得有论文说 Google 的搜索不是分布式的,而是集中式的,这一点无法考证,但现在应该早就不是集中式的了。
找不到太精确的两家收录的总页面数,但可以确认的是 Google 完爆百度。
网页规模扩大十倍,不是说服务器增加十倍就可以搞定的,因为服务器越多,负责调度的节点的负担就越重,对于磁盘 I/O,网络带宽的使用都变大,而这些东西都是有上限的,不是说简单的翻倍就可以的。
就技术来说百度也就是在中文分词和排序方面略强于 Google,但其它方面还远远落后于 Google,当然中文分词至今也没有谁能说自己做的最完美,因为毕竟中文实在是太复杂了——就比如前面的那个小心地滑。
========================= 暂时能想到的就这么多 =========================
我强调一下我的立场,去这里百度搜索风云榜看看普通用户搜索什么,再来比较准确度的问题,每个人搜索行为都不一样,自己一个人不能代表全部上网用户。
互联网有一个逻辑,就是流量决定数据。
所以首先对比一下两者的用户量,具体数据我这里没有最新的,但那很枯燥,也不想放,但大家可以对比一下,身边用 Google 的人是越来越多了还是越来越少了? 通过很多人的观察,我们能获得比较客观的对比,也就是说,如果我们都觉得身边没什么人用 Google,那就说明 baidu 压倒性占据市场,没什么可争议的。
再来分析原因,为什么 Google 竞争不过百度呢,大家可以对比一下:
首先是百度,搜索内容,很快出来:
而 Google,我搜索关键词后,这个进度条卡了两分钟没动:
所以,首先是网站打开速度的劣势,让 Google 落后于百度,互联网时代有一个特点,就是把流量聚集,但是把人的注意力和时间打散,也就是碎片化时代,在这种背景下,Google 是难和百度竞争的。
当然搜索不是唯一的竞争领域,我们也能看看其他领域的对比。
百度可以把社交和搜索联系起来,它有两大平台,贴吧和百度知道,尤其是百度知道,当人有疑问的时候,在百度搜索答案,百度知道的存在就让人对答案的获取有了稳定的预期。
以此延伸的还有 “百度百科,更加专业和详细。”
Google 就没有了,并没有 “Google” 知道,就算有一个 Wiki,但当你打开是这样的:
为什么没有中文呢?
这样谁会用? Google 在百科这一块也不行,你不弄中文如何跟百度竞争呢?
最后说一下基础系统。
我们都知道 Google 有 Android,百度有百度云 OS,因此我们要对比的是这两个操作系统。
本人有幸,两款系统都使用过。
先说 andriod 吧,这个系统搞了很多年,但覆盖的手机款式不多,据我所知,目前只有 SONY,和谷歌自己的 pixel 系列,以及诺基亚。
这三品牌都有一个特点,就是市场份额低到可怜,我都没见有人用过。因此 Android 只能跟 MIUI,colorOS 这类小众系统竞争。
再看百度云 OS:
光是品牌,就已经差不多上百,截图还截不完。
我想,对比就此结束也可以了。
结论:两者完全不是一个数量级,Google 还不具备和 baidu 进行直接竞争的条件。
百度不知道百度知道知道 谷歌知道百度知道知道
我特别反感有的人故意顺着主流或逆着主流回答时夹带私货,然而看到这样的答案之后真的是被这位答主的私货震撼了。
当然,认同 Google 的技术是业界领先,是以 英语 为互联网的核心语言的基础上得出的答案。
这个东西天天出现在我的 tl 上,那么我就贴一下这个 IR 中的经典问题
号称中文搜索强于 google 的百度,怎么你的中文分词还会不如 google 呢
自从百度给我们科里打电话说如果不参与百度竞价就屏蔽我们科室网站,彻底对百度无爱,能用 Google 一律用 Google,百度只能备用,不过没有百度也不行啊,近些天墙那么高。
2019/5/21 二更
在这里统一回应一下几个问题:
1. 本文通篇没有说百度一个好字,请某些评论不要张口就来。
2. 确实我不是技术控,想看到有关技术方面的分析,上下 700 个解答,写的很专业很详细的大有人在,我这边只是说一下从一个普通的用户的角度来看待为什么为什么百度占有率很大,因为群体的问题。
3. 结合评论看了一下,大部分评论还是倾向用中文搜索日常的东西是,百度的体验还是要好的。
4. 结合日前华为与谷歌的是想说一下, 希望国内的东西越来越好,不要被人掐着脖子。
前几天百度的创始人李彦宏提名中国工程院的院士,在网上引起了不大不小的争议。很多人觉得李彦宏即 “无实”,又 “无名”,因而再一次把矛头对准了百度和李彦宏,旧账重提,口诛笔伐。
关于百度的搜索质量和用户体验,我不用说,只要你(曾)用过 Google、有过对比,就一定能得出自己的结论。而至于百度的企业文化、商业道德和价值观,我想你也一定有所耳闻。人尽皆知的 “魏则西事件” 和“权健保健品”只是冰山一角…
更多详细的总结我这里就不赘述了,如果你想要了解更多,可以在微信里随便搜搜关于百度的文章,比如著名媒体人王志安的个人同名微信公众号就有一篇《百度,欢迎来告!》等等… 毕竟这年头:
“百度”,
似乎已经成为了一个贬义词。
而我却不想再加入这个 “口诛笔伐” 的大军了。毕竟骂百度的人那么多,也不差我这一个。相反,我想提出另外一个问题:
既然百度的名声这么不好,
为什么还这么能赚钱呢?
按照最朴素的商业规律,如果百度常年使用的 “竞价排名” 模式已经严重地侵害了其商誉、让用户们很难再相信其搜索引擎上面的信息质量,那么用户就会离开这个搜索平台,平台的用户浏览量和搜索量都会下降,而百度的社会影响力也会被极大地削弱,面对商家就没有了议价权,即使再怎么竞价排名,其盈利能力也会越来越差。
可据百度 2018 年的财报显示,在营收方面,百度在 2018 年第四季度实现的营收为 272 亿元,同比增长了 22%。第四季度实现的净利润为 21 亿元。2018 年实现的全年营业收入为 1023 亿元,相比 2017 年百度的全年营收为 848 亿元,增长了约 160 亿元,百度的整体状况看来不错,而且据相关消息称,百度第四季度的营收增长 22%,甚至超过华尔街的预期。而在所有的这些营收中,虽然信息流、人工智能等新兴业务表现亮眼,搜索仍然是营收的大头,占总营收的 70% 以上。
虽然百度近两年来的股价不尽如人意,但近两年来包括阿里腾讯在内的绝大多数中概股和美股科技股都表现得不理想,百度的股价只不过是在一个宏观经济的下行周期,并不能说明问题。
**很多时候,情绪的归情绪。但只有当你从 “在商言商” 的角度分析、用真金白银的数字得出结论的时候,才会更有说服力。**我想,这里一定有一些其他的东西值得我们深思。
有这样两个事实可能被大多数人忽略了:
- 很多人怀念 Google,当然我在美国用 Google 的体验(即使是搜中文)也远好于百度。可当年谷歌中国在中国的市场份额并没有超过百度,甚至在谷歌退出中国市场时,百度占领了中国 75% 的搜索市场。
- 现如今,搜狗、360、Bing 这些搜索引擎在中国并没有被封禁,而这些搜索引擎并没有比百度好太多,市场份额加起来才刚刚 30%,百度占 70%。
从这两个数字和事实出发,我们就可以很明显地得到一个可能让人很 “反直觉” 的结论:
百度虽然常常 “作恶”,甚至 “臭名昭著”,但市场就是可以容得下百度,而且可以让百度活得很好。
…
而至于这个现象的具体原因,我相信其背后一定存在着一个非常的复杂机理,大家感兴趣的话可以去找找关于百度的商业分析文章,从中得到一些思路。而我今天也试着给大家一个我认为有可能有说服力的解释:
百度的这个现象也许和拼多多一样,你不能理解,仅仅是因为你所处的阶层。
据我的观察,骂百度的人大多数都是一线城市中的精英人群,这些人绝大多数都有过用 Google 的经验。在搜索质量(尤其是学术词条等高品位信息)的对比之下,很容易对百度产生嫌弃之情。再加之百度这些年在医疗领域做竞价排名的 “吃相” 之难看、自己家中的老人被保健品坑害的痛恨,等等感情交织在一起,很容易就被点起对于百度的怒火。
但作为大城市中的年轻精英人群,你可能没有意识到的是,在中国广大的三四线城市、乡镇、农村地区,以及你身边一线城市中 50 岁以上的长辈朋友们中,大家对于百度是没有那么强烈的反感的。老人们仍然会对百度搜索中排名靠前的医疗机构深信不疑,甚至据我所知,很多一线城市的教育培训机构每年都在花大钱 “砸” 在百度搜索上,做广告、做竞价排名,因为真的有很多你没有看到的人群在用百度搜索,这部分人群才是全中国 14 亿人口中的绝大多数,他们才是主流,而这个主流,可以说,对百度仍然非常依赖。甚至我有时候都在怀疑:
全中国有听说过 “魏则西事件” 的人
是否超过一亿?
而剩下那至少十亿的人口,可能跟在骂百度的人生活在完全不同的世界里。这就好比城市精英白领很难理解假货横行的拼多多和有 “庞氏骗局” 嫌疑的 “趣头条” 为什么能在成立不到两年的时间里就能在纳斯达克上市,是一个道理。这方面的话题,我之前写过一篇文章叫做《农村包围城市》,大家感兴趣可以回看:心流创业心得 027:农村包围城市
和拼多多与趣头条一样,百度也许也是一种有待被中国精英人群所理解的一种 “现象”。本质上,这是“消费分层” 的一种表现。
![](data:image/svg+xml;utf8,)
从这个角度看,我们也许就更能理解这种现象了。从这件事情中,我所获得的启发是:
有些时候,跟着舆论快意地谩骂,其实很容易;但冷静下来,用客观理性的数据分析其背后的原因并获得新的认知,却很难。
说到最后,我还是得 “解释” 一句哈:我丝毫没有洗白百度的意思(百度也注定洗不白),我只是想客观冷静地和大家分析一个商业现象,获得一些认知。那么你可能要问了:
![](data:image/svg+xml;utf8,)
难道中国的网络搜索环境就好不了了吗?难道我们只能任由百度 “横行” 搜索这个行业了吗?
![](data:image/svg+xml;utf8,)
其实我觉得也不然。至少在我看来,有一些力量至少可以在搜索领域颠覆百度,而答案有可能仍然超乎你的预料。
百度和谷歌单就搜索技术而言,二者从来就不是一个量级的。
想知道两者谁的技术更牛逼,那么我们看一下二者谁掌握的专利技术多就可以了。
Google 有一个专利检索引擎,我们可以在里面找到自一九七几年到二零一一年之间的专利技术
Google 点击左侧这个链接可以进入专利检索页面。
注:语法 inassignee:"" 是限制公司名称。
因为搜索引擎只是 Google 公司众多业务的一部分,同时近几年苹果以及 Google 公司的专利大战等因素导致 Google 公司的专利技术激增。所以我在搜索条件中分别加入关键词 “搜索” 以及英文 “Search”,用以更加精确的去检索出关于“搜索” 以及 “Search” 相关的专利技术。
同时使用英文与汉语同时进行检索,我们可以看到 2 者之间的差距。
![](data:image/svg+xml;utf8,)
![](data:image/svg+xml;utf8,)
![](data:image/svg+xml;utf8,)
=================== 下面是百度的专利 ===================
![](data:image/svg+xml;utf8,)
![](data:image/svg+xml;utf8,)
![](data:image/svg+xml;utf8,)
不过,就像其他答案中提到的一样,鉴于 Google 现在在大陆的状态以及中英文之间的差距(分词技术),在日常生活中,百度还是用起来比较顺手的。
但是,既然提问者问的是技术,这个答案比上面的多数答案更有说服力(得意的笑)
3,**百度真正在搜索技术上开始发力,是在 2009 年后。这一年,百度推出框计算,在一站式生活搜索方面,开始超越谷歌。
**我只是想说谷歌其实也有框计算,输入英文就会有了。
截图:
只想说一点:“因为百度是中国的所以更懂中文” 纯粹是流氓话。前后没有任何因果关系。
特别是以我至今的经验来看,所有用上一句话来论证百度在中文搜索上比 google 好的,甚至都看不到 “自然语言分析” 这个关键词。
这种误导性很强的瞎话到底是骗过了多少少女的心啊!
说说 Google 的 PageRank 最基本的概念。
PageRank(最基本)就是假设一个用户随机浏览网页、他可能直接输入网址进入下一个网页、也可能点击现在页面上的一个链接进入下一个页面。那么,被更多链接(加权之后结果,每个链接可以有自己的权重)指向的网页就有更大的可能性被浏览到。如果这个用户将这一过程永远进行下去,那么某一网页被浏览到的概率最终会收敛于一个值(其收敛要依赖于 Ergodicity,不过 PageRank 巧妙地保证了这一点)。根据这一概率,PageRank 可给出一个所有网页的排序。当然这只是 Google 搜索中的一小部分。
PageRank 是我见过的将 Ergodic Theory 应用得最优雅、同时又极其贴合实际的方法。10 来年前火了一阵的 Graph-based Semi-supervised learning(X. Zhu , Z. Ghahramani), 说到底无非就是 PageRank 的一个变种。总而言之,PageRank 是很 nb 的。
至于百度的算法嘛,我其实不太清楚。搜了一下没搜到,可能没有公布吧。
更:说 Graph-based Semi-supervised learning 是 PageRank 的一个变种不太准确。不如说 Graph-based Semi-supervised learning 里面的 Label Propagation(最先提出这个概念的算法)的想法和 PageRank(可以认为是给一些页面加了一种特殊的状态,这种状态就是用户浏览到这种特殊状态的网页后则不能离开)。
见图。
我搜索拳王阿里,相关人物有李连杰,发哥,泰森我能理解。你把葛大爷推出来时什么意思?
简要概括一下大家的思路:
谁专利多谁就牛逼;
谁框计算做得好看谁就牛逼;
谁会算加减乘除谁就牛逼;
谁能告诉我明星生日谁就牛逼;
谁能搜 IT 开发相关的文章谁就牛逼;
谁搜图搜得准谁就牛逼;
。。。。。。
360 的周老板在 GeekPark 的演讲里说,“当时我的技术比 Google 屌,你们都不信吧。。。”
所以,我觉得,不是业内人士,没做过搜索,可能连 Lucene 都没玩过,就开始在一个题目叫 “就搜索技术而言,百度和谷歌 (Google) 是一个量级的吗?” 的问题下互喷,实在是。。。对吧?
完全可以把题目细分成:“就 [中文 / 英文][生活类 / 技术类][用户体验 / 检索数目] 而言,百度和谷歌 (Google) 是一个量级的吗_?_”
百度排名推广 seo 默默路过,百度就是个忽悠人的,没有什么攻击意思,谷歌打 9 分百度打 5 分,其中原委可以多多咨询苦逼的百度竞价专业人士,有人支持我就继续爆料?
正好刚刚针对百度魏则西事件写了篇文章,《百度真的更懂中文吗?》,转过来供大家参考。欢迎大家关注微信公众号 resyschina。
这两天 “又” 被百度刷屏了。如此大规模一致的千夫所指,百度今年已经是第二次了。暂且先不做道德评价,作为一个互联网专业人士,我想从技术和产品层面聊一聊我的看法。
先说搜索技术本身。百度一直以来的一个定位就是 “更懂中文”,事实是这样吗?让我们来做个对比。“滑膜肉瘤” 这个搜索词目前处于风口浪尖,可能会有人为影响在里面,滑膜肉瘤是第四常见的软组织肉瘤,我们换 “软组织肉瘤” 这个搜索词来看一看。在 Google 和百度里面分别搜索“软组织肉瘤”,我们来对比一下第一页搜索结果的前 10 条内容,评价方法以我本人是否愿意参考为标准给每条结果打分(+1),虽然评价方法很主观,但以我本人多年来对搜索技术及产品的认知,我有信心是具备参考性的。满分 10 分。
Google 搜索 “软组织肉瘤” 的搜索结果截图(仅截取了第一屏)。
1、百度百科的对应页面。+1
2、軟組織肉瘤 (soft tissue sarcoma) 之治療概論页面,这个页面类似于一篇综述性论文,作者是“嘉義長庚醫院 血液腫瘤科 陳志丞醫師”,我查了下作者的介绍页面[1],现任职嘉義長庚醫院血液腫瘤科主治醫師、學術組副教授級主治醫師,学历是長庚大學臨床醫學研究所博士、國立陽明醫學院學士。这个页面来自于台灣癌症防治網,隶属于財團法人台灣癌症臨床研究發展基金會,网站上明显位置列出来基金会的财务报表和捐款使用明细。我对这个领域不懂,但前段时间我自己研究海外医疗的时候得到一个基本认识,在亚洲范围内,台湾、日本对于癌症的整体治疗水平是要高于国内的,甚至有可能是远高于国内的。+1
3、互动百科的对应页面。百度百科、互动百科为国内影响力较大的 UGC 百科前两名。+1
4、来自于 The Liddy Shriver Sarcoma Initiative。Liddy 是一位计算机科学家,她通过网络记录下了自己生命最后与肿瘤病魔斗争的 21 个月的经历 [2][3]。这个项目受她的影响而成立,聚集了一批在承受类似病痛的病友以及相关的一些指导性信息。可惜的是,已于 2014 年停止。+1
5、同样来自于 The Liddy Shriver Sarcoma Initiative,有效性重复。+0.5
6、A + 医学百科的对应页面。使用 wiki 软件搭建,2006 年上线已经运行 7 年。+1
7、一份来自于复旦大学附属肿瘤医院的软组织肉瘤诊治指南,是一份 word 文档可以直接下载,总共 10 页,未注明作者。本身参考性存疑,但导向复旦大学附属肿瘤医院可以 + 0.5。
8、求医网 (http://qiuyi.cn) 疾病百科的对应页面。这个网站随便点一下咨询按钮,就会被导入到类似 “北京长虹医院 (http://kkq.zoossoft.cn)”,托管在 “忠仕伟业 - 网站商务通 (http://zoossoft.cn)”。不参考。
9、好大夫在线的对应页面。+1
10、北京大学肿瘤医院的对应页面。+1
百度搜索 “软组织肉瘤” 的搜索结果截图(同样仅截取了第一屏)。
页面顶部就是广告。。。
1、百度自己产品百度健康的广告。进去之后是一个相关医院列表,再点击查看详情,被未能直达对应 “软组织肿瘤” 的页面。+0.5
2、北京伟达医院的广告。尼玛这网站画风,我个人反正不会相信这上面的任何一个字。负分滚粗!
3、百度百科的对应页面。+1
4、百度知道的相关问答,百度知道通常会包含一些有参考价值的内容片段,但也需要大家自己甄别,至少点击作者仔细看看他都回答了哪些问题,在这种社会化产品里面,只要自己别懒,多顺藤摸瓜的看看,医托还是相对好发现的。+1
5、互动百度的对应页面。+1
6、百度文库的一份相关 PPT,权威性不明,但页面上的相关推荐增加信息量。+0.5
7、百度拇指医生网友互助栏目的一个问答,权威度有限,页面内 “相似病例” 推荐增加信息量。+0.5
8、求医网 (http://qiuyi.cn) 的软组织肿瘤专题页面。又是这货,不参考。
9、快速问医生 (http://120ask.com) 网站对应的疾病页面。专家答疑中点击专家姓名,链接到 “北京肿瘤精准微创治疗中心 (http://kxn.zoossoft.net)”,操作方法同求医网,不参考。
10、寻医问药网 (http://xywy.com) 的对应页面,玩儿法同求医网与快速问医生,不参考。
Google 搜索 “软组织肉瘤” 结果总得分 8 分,百度搜索结果总得分 4.5 分(且半数结果导向自家产品)。无论从搜索结果的质量度还是多样性上,Google 都完胜。
再说说产品。作为对比,我们在 Google 上搜索一下英文的软组织肉瘤 “soft tissue sarcoma”,第一条如下图。
Google 在顶部用了一个明显不同的样式,把结果径直倒给了梅奥诊所,即使以我并不多的医疗行业知识,我也知道梅奥诊所是世界上最久负盛名的癌症治疗中心。Google 在这里使用的样式官方术语为 “Featured snippets in search”,百度也有一个类似的 “百度框”,然而,框的是什么呢?
把广告放到正常搜索结果列表里面,这个确实是有点儿心机婊的设计,大家做了这么多年互联网产品,这种以 “高点击” 为核心目标的产品设计方案对于普通老百姓会是何种结果,我相信每个从业者都心知肚明。Google 也有类似的设计,但一来要克制的多不会一页 10 条全是广告,二来 Google 用黄色的 ad 小 icon 确实还是更明显一些。已经存在多年的竞价排名作为百度商业模式的立身之本没人敢轻举妄动可以理解,但仅针对医疗行业的广告,我还是想力荐,
1、把所有的医疗广告挪到右边去。
2、“框” 扶正气,尽量用框的形式把用户强引导到真正权威的大医院去。(虽然即使过去也不一定能挂到号,但至少给指条明路吧。。。)
3、像明示 “根据相关法律法规和政策,部分搜索结果未予显示 " 那样,在医疗相关搜索结果页面明示医疗广告可能的风险。
4、点击医疗广告跳转到目标网站之前加入一个 Landing 页面,继续明示医疗广告可能的风险。
这几点我相信百度众多的产品大牛们也一定都想得到,也肯定会有更好的方案,这事儿的阻力之大大家都明白,但还是恳请拼劲全力推动落地吧,功德一件。
1 月初因为血友病吧被卖的事情,我当时也发了朋友圈,“前段时间刚刚经历了作为病人家属的无奈与无助,深知此类行为的毒害之处,如果这是百度官方的行径,那真的是丧尽天良不得好死!” 结果证明,确实是官方行为,结结实实不容抵赖。所谓的 “能力越大,责任越大”,百度如果能够主动地向这个理想靠拢我们一定会热烈鼓掌,现实中百度作为一家商业机构选择把追求营收和利润作为第一优先级目标,我们也无可厚非。但是,百度官方出卖血友病吧这种恶劣行径所表现出来的商业道德下限如此之低,极其令人发指。
这次关于魏则西的事情,我上面虽然简单地做了一个技术和产品层面的对比,但我个人认为这件事情的性质和出卖血友病吧还不一样。Google 美国 2010 年因为涉嫌非法医疗广告而不得不接受 5 亿美金的巨额罚款 [4],谷歌未退出中国的时候也不曾幸免 [5]。伟大领袖说过,与人斗其乐无穷。虚假医疗行业因为其超级暴利性,医疗骗子们在竭尽所能想尽一切办法寻找广告分发平台的漏洞,这种魔高一尺道高一丈的竞争经年累月,对于任何一家广告分发平台都是巨大的挑战,尤其当平台自身本来就动力不足,且面对的甚至是被政府默许的骗子们的时候。
几年前,我曾经回答过一位年轻的朋友关于工作选择的问题:到底是应该选择公务员还是互联网?我当时的回答是这样的,从中国的现实情况来看,选择公务员无疑是可以享受到非常巨大的国情红利的,但为什么还有如此多充满激情的年轻人愿意义无反顾地投身于互联网行业呢,可能的理由之一是,互联网是中国为数不多的存在着相对较大的开放、平等、及自由空间的行业,在这个行业里你有机会完全单纯凭借自身的智力与努力,过上体面的物质生活,享受纯粹的精神生活。珍惜这个行业。
最后,在贵国求生指南中,谨记一定要加一条,“要学会用英文查资料,真的救命”。
注:从法律上讲,百度的竞价排名推广不是广告,但它实际是不是,我相信每个人心中都有杆秤。
[1] 陳志丞 醫師
[2] http://103.44.206.115/sarcomahelp.org/assets/images/liddy/Along_the_Way.pdf
[3] Liddy’s Journal
[4] “作恶” 不是创新乏力的解药
完整版文章地址:百度真的更懂中文吗?,欢迎大家关注微信公众号 resyschina。
我不懂搜索技术,我是来反驳 @君临的。
首先,搜索引擎只是获取信息的一个工具,不必要回答问题的时候就上来给各位知友扣上 “用谷歌用出优越感” 的帽子吧?其次,题主问的是:就搜索技术而言,百度和 gooogle 是一个量级吗?这其中的比较主体是百度和 google,比较的内容是搜索技术。
好了,现在开始逐条反驳。
1. 李彦宏的搜索技术再牛逼,就必然百度的搜索牛逼吗?举个栗子:我们球队队长,职业球员退役,拉出来单练基本功和技术,秒我们几个友队的任何人。那又怎样?我们球队的成绩也只是中游偏上而已。再从我个人的使用上来说,在我开始做销售的时候,我需要大量有效的潜在客户信息,百度出来前两页几乎是竞价排名,google 能精准地满足我的需求。
2. 单独拉出来 mp3,图片搜索,贴吧比较。贴吧是社交平台,正在这个问题下就不讨论了。图片搜索,百度比 google 牛?这个真没有,小米拍照作弊,墙纸大赛都是 google 图片搜索的功劳吧?再说 mp3 搜索,这个有点不公平了,原因大家都懂得。我们国家只能一夫一妻,某个国家一夫多妻,只有一个老婆的我被人说泡妞能力比不上娶了好几个老婆的某人,我不福气啊。
3.“谷歌追求的是最快找到你需要的网页,然后离开;百度追求的是在百度上找到你所需要的所有东西,然后留下来。”这是君临的原话,恰巧 @和菜头刚刚在微信写过一篇文章 “为什么我不去百度”,其中有关于搜索引擎价值的判断“百度是搜索引擎公司,搜索引擎的天生八字就是:拿了就跑。用户飞快地跑来,找到内容转身就走。一个搜索引擎公司越是成功,用户单次访问的时间也就应该越短 — 这意味着用户可以在最短时间内找到自己想要的内容,也就体现了公司的最大价值。” 我个人很认同这样的判断方法。这不正说明 google 的搜索价值是大于百度吗?
反驳完结!
扯个蛋:作为一名工具使用者,google 让我更喜欢,我相信这背后是有强大的技术支撑。
另外,这是由 MX2 完成,很辛苦,求赞。
你们吵吵啥?
体验差别最大的莫过于我们这些工科男了!!
我想做个西红柿炖牛腩,绝逼用百度!
我想做个氯甲基甲基二甲氧基硅烷,绝逼用谷歌啊!
做科研用百度?你试着在搜索框里键入 “如何” 俩字,你特么逗我呢?
搜索技术需要一个前置定义:
是仅仅针对各搜索引擎面向的主体用户群进行搜索时反馈的搜索结果的体验,还是基于互联网目前所有的数据所进行检索,处理,分析的能力。还是其他。
我的意思是,搜索技术在目前的语境下是个相当模糊的定义。简单的粗暴的判断谁好谁差是不公平的。
以前面的体验来说,在中文范围内,普通的中文生活化关键词搜索百度反馈的结果更加符合搜索人的要求。而谷歌在这方面现阶段来说相对做的并不好(BTW,也许 google 有能力和有机会做好,但假设性的判断不能作为技术能力的判断标准。)
同样在互联网所有的收录数据下所进行检索,处理,分析能力,毫无疑问 google 在这方面表现出了相对于百度甚至其他所有搜索引擎的绝对化优势,这也是为什么近期自从屏蔽了 google 后,有学术方面的查询的需要的学生们需要第一时间了解翻墙技术的重要性的原因。
其他方面就不在一一描述。
我个人对于百度和谷歌之间的评价就是,百度是适合目前中国国内的普通互联网用户需求的一个搜索引擎产品,但我个人认为他能做的更好,但问题是这个做到需要的成本和带来的用户期望及忠诚回馈相关数据会让百度拒绝在这方面的投入。
而谷歌,它只是由于特定的原因损失了一个国家的用户而已,但它还是那个谷歌。
两家公司的侧重点不同而已,我看过一个数据,但记不太清楚了,大概是百度 80% 以上的收入来自推广,谷歌只有 20%;谷歌覆盖的面更广泛,所以在未来百度是否在其他地方和谷歌比肩,敬请期待;
-——————————————————————————————–
多谢评论几位的提醒,我后来在 199IT 中查了下,确实谷歌在 2013 年 Q2 的财报中有提到
谷歌第三季度营收(广告及其他业务)为 137.7 亿美元,在总营收中所占比例为 92%,比去年同期的 115.3 亿美元增长 19%。
原文就不做修改了,附上财报链接:http://www.199it.com/archives/161939.html
-———————————————————————————————-
另外,我还是表达我自己的观点,百度在破坏更多中小型网站的利益,之前在知乎也和别人讨论过这个问题,百度开发如此的多的产品,无疑是想把用户留在百度页面上,看似很接地气,多方便我们的网友,而背后却是多家网站的竞争,被百度利用乖乖的贡献了自己的资源,最后百度一脚踢开自己玩;
所以我的理解,
百度:我的就是我的,你的你愿意也是我的,不愿意也迟早变成我的;什么,你是富二代,那我们可以合作的;
谷歌:我有资源,我带着你们中小网站玩,只要你有区别于其他网站的内容,有钱大家一起赚;
针对上面一点有异议的,每个人看法不同,不想再做讨论了;
最后和
交流下,之所以百度有这么多的搜索结果展示样式,是因为百度在这上面有 N 多个部门,光我接触过的就有 3.4 个,每个部门涉及的种类不同,每个种类还有不同的样式,所以看就觉得太乱。
今天重温《三国演义》,看到形容刘备长相的一个词:**“天日之表”。**不禁很好奇,天日之表到底长什么样,就用百度图片搜索了一下。
然后又用谷歌图片搜索了一下
谷歌和百度的差距,就像金毛跟哈士奇的差距一样。
我就发两张图,你们自己感受一下
搜 qq,下载 QQ,下的却是百度助手
什么时候是一个量级过?
一个知识产权都得不到保障的国家,一个大学教育水平看不下去的国家,一个大部分员工都不可能得到户口的城市,我觉得百度能和 Google 比较就已经很不错了。
其实在什么样的国家,就有什么样的公司,否则根本就没有办法生存,以上。
针对
的图片小小吐槽下
好开心啊
-———– 开心的分割线 ———-
为何你要揪着张柏芝不放,还要问他儿子的爸爸是谁?
你怎么知道谢霆锋就是正确的答案
这么具有争议的问题
怎么可以拿来和人家辩论呢?(好像有什么奇怪的别人的东西混进来了)
而且难度太低,以下是提高难度提出的相似问题
接下来便要指出 Google HK 也是在我大天朝的
香港也是中国的一部分
所以 Google 也是有着各种呵呵呵呵谐 所以但就搜索技术 参考性较低
下面是 Google uk 的搜索结果(输入 shanghai 都会被和谐 跪了)
可以看出 Google 也是有那个小框框的 呵呵呵呵而且广告明显标出了
-——————– 先写到这 ———–
百度最恶心的是搜一些植物,昆虫,或者病的时候,侧边栏会强制弹出一堆关联的很恶心让人看了很不舒服的图片。而且这个侧边栏是无法关掉的。
比如搜红斑,过敏,侧边栏会弹出糜烂的皮肤图片,红斑狼疮都出来了… 我并没有想看这些图片好吧。比如搜薄荷长不长虫,侧边栏就各种可怕的虫的图片… 我是想种薄荷但怕虫,结果被逼看一堆这样的玩意儿…
最讨厌百度这点。
搜索引擎的量级你要考虑到以下二点
覆盖区域 覆盖人数
谷歌的覆盖区域是全世界
百度的覆盖区域主要是国内
谷歌的覆盖人数是抛出中国 朝鲜等的所有能上网的人
百度的覆盖人数是中国 + 部分海外华人
好了请你告诉我单就技术而言 这两种规模下的搜索引擎会是一个量级么
之前我总是觉得,都是搜索引擎,能有多大差别。进行一般地搜索的时候,我不会在乎我用的是百度还是谷歌(当然后来谷歌也没得用了)。
直到今天,我才深深深深地感受到了二者的差别。
背景是这样的,我们的 python 课程的老师带着几个同学去参加在旧金山的一个 meet up,大概类似于程序员们聚在一起,由比较牛逼的几个来给大家讲讲我们又做出了多么多么厉害的东西,在一片其乐融融中欢度夜晚。
我们就坐以后,老师看了一下今天要做演讲的人的名单然后很兴奋的告诉我们说,第五个人是 julia 的创作者(大概是这个意思)之一。julia?必须承认我确实见少识寡,没有听说过这是个什么东西。看到老师和他的朋友在和蔼地看着我,我怎么也要知道这是个什么东东啊。
于是我打开了百度。其实在美国我也习惯了使用 Google 了,但是当我需要快速了解某个事物的时候,我还是很希望能先看到母语的定义,我觉得这让我能快速了解这个东西(还是英语不够好)。于是百度 julia,搜索到了如下内容:
我。。。。。。旁边老师和他的朋友还是一脸和蔼地看着我,我真心希望他们没有看懂这是什么东西。赶紧打开 Google,再次搜索 julia,得到了如下内容:
第一个链接就是我要找的,Julia is a high-level, high-performance dynamic programming language for technical computing, with syntax that is familiar to users of other technical computing environments.
当时我深深地深深地感到了一些不同,但是我也说不清楚这种不同存在于哪里。当然用这么一个例子就说百度的搜索技术和谷歌不在一个量级我觉得肯定也以偏概全,具体那些搜索的技术我也不大了解。但是站在我个人的角度上,谷歌这次做的要比百度好。
知乎黑百度已成政治正确,但是再想想,其实没用。。懂的自然黑,自然明白。。不懂的仍然不理解为什么要黑,甚至洗地。。。
而百度的主要用户恰恰就是后者,把他们当成脑残,百度好像很体贴地给这些人灌输百度好的概念。关注这个问题、回答这个问题的大多都是黑百度的人,而真正爱百度的后者用户,你跟他说什么都是无稽之谈。
是不是该上这张图了?“三点透视图” 的图片搜索在百度和谷歌的结果
update =========
说 google 强没人否认,但是个别指标百度并不弱。而且百度走的是完全不同的路,既引导用户贡献有价值的内容,比如百度知道,文库,贴吧,百科,还有框计算引入第三方贡献的内容。google 强调的是作为工具的中立公正和高效。
发展思路不同而已,说 baidu 技术一无是处的也没有什么有说服力的证据。仅仅是因为 baidu 人为干扰排序结果就完全否定 baidu 的技术吗?恐怕太片面了吧。
============================================
看不到任何有实际内容的答案。
我不是业内人士,但据我有限的知识和观察。
百度对于非中文的搜索,排序比起 google 几乎毫无战斗力。
对于中文,百度并不弱于 google。就分词来说百度还略强于 google。这也不奇怪,中文收索和英文区别不是一星半点。只是 google 得益于强大的研发实力,现在已经几乎平手。
google 强大的是在维护收索结果的公平公正方面的技术实力,包括网页相关性,去除排名干扰(反作弊)。百度这方面差距较大。
最后差距更大的其实不是技术层面。google 的理念是 “让使用者找到自己想找的”;百度是 “让使用者看到百度想让他看的”。
从用户角度,百度搜八卦,谷歌搜资料。
最近正值《变形金刚 4》热映,笔者用百度搜索 “变形金刚”,发现结果页瞬间变成一个“擎天柱”,并最终演化成一句文字:“变形金刚三十周年,百度搜索为你而变”。显然,这是一款为广大“刚丝” 定制的另类创意,只不过,掀开技术之上的 “人文关怀” 面纱,百度搜索近年真的在上演 “变形记” 吗?
上个月,一则 Google 支持西部教育的新闻引发 “重返中国” 的猜想,在知乎上,更是出现一个热门话题,“百度和 Google 的搜索技术是一个量级吗?”作为一名 Google 粉,我一直在思考一个问题:如果 Google 重返中国,还能够击倒百度吗?
不一样的进化理念
在 Google 退出中国之后,笔者被迫逐步减少了 Google 的使用,既有稳定性的原因,也有搜索体验潜移默化的影响。但在我看来,即使 Google 重返中国,不只没有机会击倒百度,追赶百度恐怕都是难以完成的任务了——因为百度中文搜索进化了 4 年,Google 却止步不前。
除了文头提到的 “变形金刚’之外,在前几天我用手机百度搜索“越位” 结果则直接是关于越位解释的示意动画。用单个 CASE 来对比百度和 Google 并无意义,因为 CASE 无法穷举,搜索又主要在做长尾需求与长尾内容的对接。但不妨对比回溯一下 Google 百度近年来的进化理念。
从百度历史看,一次具备里程碑意义的创新始于 09 年的框计算和阿拉丁计划。“所见即所得”,是框计算的核心理念,如今已经成为搜索引擎的标配,在最早却也是 Google 效仿的对象,也正是自 09 年以来,百度在一站式生活搜索方面,开始超越 Google。
2013 年,自百度发布寓意着下一代搜索引擎的 “知心搜索” 之后,阿拉丁被再次升级,同时,更加强调 “即搜即得”,它通过对大数据的挖掘,从数以亿万级的知识库数据中挖掘出各种知识碎片、形成答案,直接将高质量搜索结果在大搜索中进行聚合和展现优化,以知识图谱的方式把答案直接呈现给用户,还可以和用户实现智能交互,有问必答。比如,在搜索框中输入母婴相关关键词,如“怀孕”,左侧搜索页面即会显示“怀孕” 相关的百度百科内容,会为用户推荐相关“怀孕手册”,聚合展示孕妇在备孕、孕早期、孕中期、孕晚期、分娩、月子个阶段注意事项,同时,在搜索页面右侧将显示相关信息如“育儿指南时间线”,这被百度在内部称为“母婴知心”。
类似基于用户体验的知心搜索,涵盖了人物、小说、影视、音乐等等十余种,这种搜索结果页,有图片、地图、表单、贴吧、知道、百科等内容的直达,左侧智能交互,右侧推荐更丰富。而在商业层面,百度靠传统搜索推广这 “一招鲜” 已吃了十几年,但是,在引领下一代搜索引擎进程中,百度也引入中间页的新理念来自我颠覆,尤其在最近一两年,在去哪儿的典型案例之外,医疗、教育、游戏等每个大行业的垂直搜索中间页都在暗自发力。相对的,这种整合垂直搜索领域,建立最庞大生态链的信号,在 Google,乃至任何一家中文搜索引擎,都不可见。
纵向比搜索同样的结果今日的结果页与 5 年前、10 年前都相差甚远;横着比,与 Google 搜索对比一组关键词会发现百度结果丰满、好用很多。这是为什么我说 Google 重返中国已无法超越百度的原因,其搜索体验甚至都赶不上搜狗。
百度和 Google 技术谁最强?
近日的热门话题 “百度和 Google 的搜索技术是一个量级吗?”,这是一个不算专业的问题,因为技术发展并不是线性的,往往是理念改变引发革命性的进步。
其实,回到搜索引擎的技术原点,Google 今日引以为荣的网页评级机制 pagerank 技术,直到 2001 年才被授予美国专利,比李彦宏的 1996 年申请的超链分析专利技术晚了 5 年。
于是,当下来讨论技术问题更是饶有趣味,不少非专业的回答大多是一边倒认为 Google 更牛逼,最典型的说法便是,Google 有无人驾驶汽车、Google Glass、Android,有甩开 Hidoop 几条街的 Caffeine、Pregel、Dremel,还有 GFS 文件系统和全球数据库 Spanner,百度却只有搜索。
这很可能是关于搜索引擎技术非常大的误区,我个人感觉,Google 的创新能力毋庸置疑,但在搜索引擎技术和用户体验上,最近 4-5 年并没有明显进步。
对于今天的 Google 究竟是什么,将走向何方?近日 Google CEO 拉里 - 佩奇的公开信中似乎也曝出 “回归搜索” 端倪——他强调搜索和信息是 Google 的核心,也坦言“从许多方面来看,目前距离创造我梦想中的搜索引擎还有十分遥远的距离。”
相对的,百度搜索引擎技术近年来的创新是否有干货呢?
过去,在底层架构上,外界容易视 Google 比百度先进,不过,近几年却不能忽略百度在基础架构上的默默创新。年初,百度被曝光正在秘密研发 “极速搜索”,它可以通过大数据计算能力,比普通搜索节省 80% 时间,打开瞬间最快只用 0.04 秒,其实,这项技术的意义并不止于用户感知,背后蕴含的实际是架构的重构、优化,在性价比、响应速度等各方面都在加分。
如今,在对于搜索引擎技术发展走势上的判断,Google 和百度似乎也走到了分水岭。个人认为,“自然语言人机对话 + 智能化逻辑思考”,也就是,让搜索更能理解你的问题,给你更准确的答案,是百度正在践行的方向。7 月 7 日,在 37 届信息检索领域世界顶尖学术会议 SIGIR 会议上,百度副总裁王海峰做了题为 “ChineseSearchEngine-Baidu’s Practice” 报告,这场演讲引起了广泛关注,很多人问及关于深度问答、知识抽取、智能交互等这些技术百度是如何实现、如何应用的,即使是 Google,也尚且未将这类前沿技术大规模应用于搜索产品,外界惊讶于百度在搜索引擎产品中的应用,并已提升了用户体验。
曾经有一个颇为争议的案例,在百度搜索 “谢霆锋儿子的母亲的前夫的父亲” 是不是人工干预的。因为百度可以直接显示”谢贤“,但 Google 不行。Googl e 也提出知识图谱概念,但是,凭借对中文的理解以及百度拥有的自主知识库,对知道、贴吧和百科现成的 SNS 知识可以有机整合,通过逻辑思考,a 推出 b,b 推出 c,c 推出 d 的结论,将答案 d 直接回答给你。但 Google 就做不到,他只能给你答案 b,c 之后的结论就只能由你自己去寻找了。
当然,搜索 “谢霆锋儿子的母亲的前夫的父亲” 是个极端案例,不过,以知识库为基础的逻辑推理等会让搜索越发智能。比如,最近汤唯结婚消息一出,百度搜索结果右侧出现了一组 “那些年汤唯爱过的男人们” 智能推荐,有意思的是,连 “16 岁花季相识短暂初恋” 等人物关系都能标注出来。另外,值得关注的是,百度在知识库上探索的样式已经比 Google 更宽广,比如,搜索“北京的景点”,左侧结果页有多种类型的景点推荐,包括亲子、情侣和家庭游,乃至毕业旅行的景点推荐,右侧推荐中,包括北京度假热卖排行榜,以及相关地名。其他基于知识库的创新例子也并不鲜见,搜索“不掉毛的狗”、“开黄花的树”,用户都能发现今日的搜索已大不同,而这种长尾效应必将体现在百度搜索流量增长乃至营收拉升上。
从 2010 年初百度成立了自然语言处理部至今,词法分析、语法分析、语义分析、机器翻译、query 理解等一大批技术已经处于世界领先水平,并在深度问答、情感分析、智能交互、知识挖掘与推理等前沿方向上迅速进步。6 月底,在全球自然语言处理顶级学术会议 ACL 上,6 位百度人赴美参加。2013 年初,王海峰更是出任 ACL 五十年历史上第一位华人主席。无疑,如今的百度已经走在 NLP 最前沿。再看,对技术的投入上,百度与 Google 更是大相径庭。自 2008 年左右,当 Google 将研发重点投向其他领域的时,百度仍将资金和人才聚焦在如何让搜索更智能。
未来,用户对这些技术的感知将愈发明显,好比之前不断走红的:百度翻译实物拍照卖萌又高级黑,人脸识别 “明星脸”,百度语音助手的拍花识花……
除此之外,去年,在离苹果总部不远的加州库比蒂诺,百度发布了专注于深度学习研究的前沿实验室。在全球范围内,目前除斯坦福大学等高校研究机构外,唯有百度、IBM、Google、微软四家企业设立了 DeepLearning 专门研究机构。而且,在跻身深度学习研究的第一阵营之后,今年,百度更是将 “Google 大脑” 的负责人、人工智能行业的资深科学家吴恩达挖至新建立的美国研发中心,主抓 “百度大脑” 项目,这势必将为百度在技术和人才上保持领先埋下伏笔。
最后,再次声明笔者是 Google 粉丝,但我不得不承认的是,百度在中文搜索技术上已经甩开 Google 一大截,就算 Google 重返中国,也已不再是百度的对手,时间不等人。
十五年前,中国和美国两个搜索引擎公司几乎同时起步。 十五年后,一个在研究量子计算机的可行性和自动驾驶,并研发了阿尔法狗这样的超级人工智能。 另一个则在奋发研究卖广告,贩假药,玩流量,送快餐。 它们的名字:一个叫谷歌,一个叫百度。一个挑战人类智力的上限,一个挑战人类道德的下限。
百度是卖假药的,google 才是搜索的,不可比。
今天在 Wiki 上看快速排序的伪代码的时候看到一个符号
这是啥 (゜皿。)
于是赶快用 Edge 的地址栏查了一下:
(☉д⊙)
没关系,Bing 还是小朋友嘛,下面请出 Google:
(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)(☉д⊙)
难道这是地球人的机密??
于是无奈之下想起了百度:
虽然下面几条都不对应但是至少有对应的 baidu pedia 好嘛。。
于是我又做了一次试验:
这回是 C++ 中的最常见的一个逻辑运算符加上等号~
百度好棒~~~~~(^u^)
再搜索几个逻辑运算符:
&&
谷歌终于和百度打了个平手,必应继续看天。。╮(╯_╰)╭
||
百度四战四胜~~~(((゚Д゚;)))
讲真,为毛 Google 对符号的支持这么差呢?记得以前用 Google 搜索 Linux 命令也是一团糟的样子呢~~ 至少在以上所述的符号的搜索中,百度的技术还是比 google 有用一些吧~~~
(,, ・ω・,,)
我从 2001 年第一次用 google,作为程序员,直到现在,每天都用,我一直认为百度搜索水准远低于 google,直到我开始为搜索引擎写代码,看了 N 多 query 评测报告之后,才改变这个想法。
搜索引擎程序员每天都会收到 N 多 bad case,日常工作就是 case by case 的修 case: 分析问题 - 归纳 - 找到原因 - 提出策略 - 评估策略对其他 query 的影响。这个过程是没有终点的,每天都有新的网页新的内容出现,这个月的策略下个月可能就不能用了,某个策略对这批网页有效,对下一批网页可能就是负作用了
简单的说,搜索质量和网游一样,好的搜索体验需要长期的运营积累,不要指望突然发明一个算法,搜索质量马上提高 50%,如果可能,那一定是你之前做的太差
从技术细节角度,影响搜索质量的因素很多,最重要不是外行以为的中文分词,而是 query **意图识别,**什么机器学习,deep learning,NLP 之类,全都是为意图识别编造数据
总之,搜索质量是个长期的活,你每天都得修。它和市场份额是正相关的,百度每天搜索 uv 6 亿 +,差不多 60% 的市场份额,**百度确实是最懂中文,**而 google,因为被 xxx,市场份额逼近 0,这将导致 google 的中文搜索质量越来越差(google 中文搜索目前已经是 4 家中最差的)
网上认为 google 搜索质量比百度明显好的原因如下
1. 天天用 google 的码农在这个技术问题上话语权高,而他们搜索的大部分都是英文单词,实际上中文技术网页不够多,高质量的 page 大部分是英文 ,而国内搜索引擎以采集中文网页为主,文档不全
2.google 本来因为中国市场份额减少,投入修 case 的码农不够多 - 导致中文搜索质量下滑,但是他在英文搜索上一直高强度投入,这会让搜索英文单词的为主的码农觉得满意
搜索引擎技术并没大家想的那样高大上,如果某家国内搜索引擎要提高码农心中美誉度
集中力量修技术类 query 的 case 就行,很快可以搞定
每次用百度搜出来的结果,我都会有个疑问,是不是有更好的网页被它屏蔽掉了。
于是又会用谷歌再搜索一遍…………
所以现在非敏感词的搜索,我都用谷歌。
百度: 不知所云
谷歌: 似乎和阿里有 py,但是命中了
当然不是,比起谷歌来,百度更懂人心。
国人都是拾人牙慧?google 山寨百度的专利文件曝光
现在有不少人自称 google 的 “脑残粉丝”,下面的事情不知道他们是否知道?
记不清是在 1999 还是 200x 年来着,在某 IT 报刊上看见当时的江湖传闻:李彦宏在国外某大学演讲,展示研究搜索引擎的超链分析(ESP)技术,2 个小年轻一直记笔记,而且后来还详细询问他其中的很多技术问题,后来李彦宏才知道他们是 Larry Page 和 Sergey Brin。然后的事情嘛……
2000 年那会的搜索引擎确实比现在弱智得多,但是 BAIDU 那时候搜索比 GG 准确太多,尤其是中文领域,虽然其搜索范围可能没有 GG 那么广。
李彦宏 15 年前搜索专利曝光:谷歌创始人拾惠 http://blog.sina.com.cn/s/blog_543400a60101bq86.html
俺认为各有所长,总体上是 GG 技术高,但是 BD 也有优点
首先我们先来看一个 2020 年全球搜索引擎的使用占比图
从这个图我们看出来,google 以绝对的优势占据老大的位置,占据了全球市场的 92%。
百度对外声称是最大的中文搜索引擎,最早的时候确实百度的中文分词做的比 google 好一些,但是现在的话 google 对于中文的搜索已经不会比百度差了。
如果你经常用百度和 google,你就会发现百度搜索出来的东西有时候并不是你想要的,或者你翻好几页才能找到你想要的,但是 google 会在第一页前几条就给你想要的。总结就是百度给你他想给的,谷歌给你你想要的。
百度肯定也是想打开国际市场的,谁不想让自己的领域更扩大一些,但是多年的发力却收效甚微。
抛开搜索,我们还可以从其他领域对比一下两个公司的技术,比如 google 的人工智能和机器学习,比较有名的比如 AlphaGo ,当年着实在世界上火了一把,也间接奠定了 google 在人工智能领域的地位。
百度也想在人工智能方面发力,陆奇的到来就是很好的证明,百度也想大刀阔斧的改革,但是最终却是截止目前也没什么可以拿得出手的成果,在雅虎和微软担任高管的世界级顶级人才陆奇也离开了百度。
在大数据领域现在成了标准的 hadoop 也是最早按照 google 的三篇论文来实现的,百度曾经也想基于 Google 论文独立实现一个自己的系统,但开发难度过大直接导致项目夭折,由此也看出来百度和 google 在大数据领域的技术差距。
所以在大数据领域,有这么一个说法,如果你想了解最新的行业动态,或者最新的技术,请关注谷歌的论文。
在中国,可能阿里更像是中国的谷歌,而百度只是一个搜索公司。
其实 google 搜索只不过是其母公司 Alphabet 下的一个产品,除了搜素还有 android、YouTube、chrome 等等,但是百度没有了搜索就什么都没了,所以 Alphabet 的理念就是 google 负责挣钱,Alphabet 负责改变世界
该题本就没有答案,因为评判标准注定夹杂着许许多多的主观。例如《我是歌手》的选手,真的第一名就最好?未必。评判搜索引擎的体验只有一条标准——返回结果是否合你胃口,但这个本质上是靠猜你的主观意图,这注定是猜不准的。这跟歌手选秀比赛是一样的,到了一定水平后,你就很难去说谁谁更好。
不过我倒是想到从技术角度可以如何去评价两个搜索引擎的优劣:
1、新建一个站点,充满千万页面,每个页面 title 只包含 1 个词,需要性能足够优秀,支持高并发,假定不宕机
2:百度和 Google 同时对这个站点进行索引,限时 5 分钟
3:选出 100 个页面的标题在两个搜索引擎中进行搜索结果对比,看返回数,看目标页面是否排第一
但是…… 这样的对比,是完全无实际指导意义的~~ 只是技术宅的游戏而已,最终,我们还是看,市场占有率。
指导思想的不同造就了百度和 Google 的不同,他们的目标客户是不同的好么,至于技术是不是一个量级的,我就呵呵,美国总统的工作和我们大大的工作可比么,不可比么,各司其职各有不同而已。 搜索学术问题和图片的时候,个人更偏爱 Google,不得不承认,Google 的界面简洁美观,搜索精准速度也快,最大的缺陷如前辈们所说是敏感词汇问题。就实际用户体验来说,使用 Google 的人(chinese)大部分是受过高等教育的,他们有一种 “使用 Google 高大上,Google 迅速好用” 的认知,至于是不是一定比百度好用,用惯了一种搜索引擎的人是不会去公正评价的,因为在评价的开始,已经从心理上否定了其他。 我并不是说用百度的就是小学生,事实上,我就是那个在两种搜索引擎中摇摆不定的坑货,我用 Google 浏览器,但在 Google 浏览器里把百度设置成了首页。别问我为什么,用起来方便而已——身为学生党,我用 Google 搜索学术问题,身为 chinese ,不得不承认真的是“百度更懂我”。百度这几年的进步我们有目共睹,听腻了播放器里的歌,想看看什么电影,需要搜索路线,我第一个想到的,是百度。 百度的周边产品很多,如 @君临所说,五花八门的东西没有将百度拖垮,而是使其壮大,人都是懒惰的,谁能更好的满足人的需求,谁就该得到人的青睐。 至于底线问题,不得不吐槽百度的结果呈现确实很像广告小黄页…… 求美化,求少广告。搜索引擎需要节操么?不需要么?底线又在哪里?同学你真是想多了,作为一个搜索引擎,存在的意义就是为用户呈现答案,在法律与道德允许的范围内,一个好的搜索引擎就应该以为用户提供其需要的服务为中心思想。 到最后突然意识到…… 我这是偏题了吧喂 =_= 总之我就是想说,该用嘛用嘛,符合个人需求就行,好奇心满足了就该干嘛干嘛去~
首先是搜索技术,就全语言而言,谷歌是占据绝对优势的,就中文搜索而言,百度这 low 货靠的是人多,热门的就人工干预,什么张柏芝儿子的爹,这种东西玩起来觉得高大上,但是事实上你真的专业起来,百度就只能说帮不了你了。而谷歌同学已经二逼的不行不行的了,整部维基百科全语言版都被它理解了,用来做框计算,而百度虽然有这方面的努力,但是现在,目前能用的还是模糊语态识别和人工数据采集。框计算在前些年确实百度中文领先于谷歌中文,首先是百度只做中文,所以 09 年就能开始发现百度在使用,然而谷歌其实也是有的,只是功能就在计算器、天气预报和汇率换算方面。现在谷歌的框计算已经包含所有维基有完善记录的各国名人,而且记录更新都是自动抓取更新的,而百度这 low 还只能根据热门信息,手工整理。
其次是可用性,百度在国内网络环境中可用率高到爆表,在谷歌中国期间,我们的感受是谷歌打开稍微快点,但是也没特别快多少,但是现在谷歌只有少数人能打开,而且慢得多,所以没必要再去讨论搜索技术什么的,你去百度一下谢贤的孙子是谁,用哪个搜索引擎,只要智商 OK,都没有问题,没必要讨论搜索技术哪家强。
然而百度通过垄断,恶意屏蔽网站,强行推广自己的产品,这么做无异于火中取栗,最终是会死得其所的。所以咱不点百度的推广,也不看百度的广告,静静地看着它装逼。谷歌这网站总有一天会重新能打开的,到时候看百度这 low 怎么用渣一样的技术和神一样的公关去打败外国狼。
突然想到几年前一篇报道:
Google 有多大?它有 20 亿行代码,相当于写 40 遍 Windowstech.ifeng.com
作为学生党感觉还是 google 比 baidu 厉害些:
说说你一大早起来看到这个首页,你是什么心情?
再说说一大早起来看到这个首页,你是什么心情?
…
最后说说你一大早起来看到这个首页是什么心情?
跟大家说个事。先讲背景。
今天是 2019 年 5 月 11 日,昨晚英雄联盟 MSI 季中赛 iG vs G2 那场有点晚了,没看完就睡了,然后今天早上起来想看看谁赢了,于是上网搜。
我理想的搜索结果是类似足球赛积分榜这样的:
我想着电竞比赛应该也有类似的榜吧,然而…
这是百度搜索结果
我以为是我搜索的关键词太模糊了,于是接着搜
耐心看完这头一页全部搜索结果,到这时候我已经急了,我就想知道个比赛结果,接着就去谷歌搜了一下
这是谷歌搜索结果
根据相关法律法规和政策,部分搜索结果未予显示。出现这个百度想赢都赢不了 外事问百度 内事问谷歌
前几天想起来好像以前有个韩国男团
大概还小学时这个团很红 印象中我们班女生很爱
后来默默的消失了
用 GOOGLE 搜有该男团的 WIKI 条目
可是搜近况照片没找到
结果我突发奇想用百度试试 因为很合理麻 毕竟中文化圈不会用那个字眼去看美女图
果不其然百度有我要找的结果……
这边当然不是指百度好用
只是很多种因素交互影响……
很有趣
H.O.T……
在 google 没有被封的时候,其实 google 的中文搜索,单从我这边的用户体验,还是比百度要好 N 条街的,我经常在 google 里输入 “为什么 XX 药可以导致 XX 副作用”,“法洛四联症杂音的特点” 等信息,结果总是 google 能给我找到更相关的内容,而百度… 罢了不提了。
后来 google 被封了,用中文使用 google 的群体感觉只有对岸的台湾同胞了,现在 google 的中文搜索结果的确不太顺畅,但是,我的应对方法是把相关内容翻成英文搜 google.
我真心觉得对于我这个专业的人来说,google 搜索应该是刚需,否则想搜个人流并发症的病理生理机制,而百度只会给你回馈 “无痛人流 XX 好” 心都要塞死了。这不光是广告的问题,我觉得在定位信息的精准度上,尤其是专业信息上,google 真的能把百度爆出翔来了。
今天在网上搜 log 这个关键字 最满意的是 bing,其次是 google,百度认为我搜的是 logo 这个词,结果简直莫名其妙
当年大陆的 google 闹退出那会,具体我也不大清楚是发生了什么矛盾,反正有一天下午 google 把许多敏感词解禁了,很多广场图片和文字信息都可以搜索到。同一时间,baidu 的搜索也是同样,我觉得给 baidu 一百个胆子它也不敢解禁这些,有理由认为当时的 baidu 是以 google 的搜索结果为基础再重新进行过滤排序。没截图,你们就当笑话看吧,不过当时很多人进行了这个测试,相信会有人知道我上面写的这段故事。。
反正做开发的去 Google 搜索准没错..
-–
我觉得还是发展方向不一样 国内和国外用户使用搜索引擎的目的不同 国外更注重搜索 尤其是很多专业资料他们也喜欢搜索 而在国内很多资料根本搜索不到 也就是资源的差距 我们的网络用途更多是游戏 娱乐 国外大多是搜索资料用于办公学习
% 今天在谷歌 play 看到一个战略手游,下载量老高了,瞄了一眼开发商是某国内的 lemegame,没听说过,有点好奇就点开搜索引擎,
结果如上,什么玩意啊。于是换了 Goole 搜一下
我又一想,或许是因为搜的不是中文,所以度娘不给力,就换了点中文关联词。
什么叫专业搜索引擎啊 ! (战术后仰
更新:百度抽风?体验极差,每次搜索都弹一次
没有对比没有伤害,刚才搜个资料吓一跳
以下是百度学术的搜索结果:
你这广告几个意思?!
百度一下的:
百度丝毫没意识到贵乎的重要性啊,而 Google 如下:
当我在百度上搜索 “露从今夜白”
然后出现的置顶讯息是这样子
的时候……………………………………
我就对我们国家最大的搜索引擎死心了:)
不是。搜索是一种基于自然语言的技术。一个单一语种的搜索引擎和一个多语种的搜索引擎不存在技术可比性。
以后不要这样黑 Google 了好嘛
Google 在搜索框下面就有 “Search Tools”(限制时间、国家、排序。。。)而百度没有,甚至高级搜索现在还隐藏到“设置” 里面去了,光这一点,就觉得百度不如 Google,更不要说技术资料的搜索结果质量了,要不是国内要翻墙才能用 Google 导致有时候速度太慢,相信我,你不会再想用百度。
个人认为
举的中文句子、用中文表达的算式几个例子,以及举的如 mp3 、图片、贴吧、地图的例子,都不能表明 Google 和百度在搜索技术上的差别。
为什么?
谁叫你们把谷歌赶出去了啊?搜索技术再牛 X,没有数据也白瞎啊。
Google 街景车能上路的话,百度地图算什么啊?
扯远了。
回到主题,搜索技术的优劣从什么地方体现?
无非收录页面的数量 / 实时性 / 搜索的速度 / 搜索的准确度 这几个方面吧?搜索技术的优劣跟付费推广有任何关系吗?20150504 update:
有些地方写的不好,引起了知友的争议,这里为我自己不仔细思考就写回答的行为致歉。
把 Google 赶出中国并不影响爬虫收录网页,但是会影响到 Google 给中文分词算法、特色搜索等本地化工作分配的资源变少,这也是搜索技术的一方面吧……
Google 没有测绘资质,中国地区的地图是从高德等服务商购买的,因此街景车不能改善地图的底图部分的质量,只能提供街景服务和改善定位效果。当然它肯定搜集了很多其他信息……
我贴下几个平时经常用的搜索图片吧:
平时还会遇到一些 excel 的问题,不知道怎么描述。大多都能通过 baidu 搜到解决方法,google 很难搜到,或者搜到的都是百度那边的。(这是叫模糊搜索还是小白搜索来着?)所以从实用角度来说,比较偏爱 baidu
大致的很像是。一个是商人研究科技,一个是科学家研究商业。。。。。。。。。。。。。。。。。。。。。
永远记住。google 创立之初,人家说的是我做的是 AI,不是搜索引擎。
百度呢?我司是个广告平台。
在百度做过排序
首先说下怎么评价搜索引擎的好坏。
好不好不是一个人说了算,也不是一个 case 说了算。评价两个搜索引擎需要很多人对很多 case 进行评分,最后综合一个结果。
我说下其中一种对比的方法:
请 100 个用户,每天对 baidu 和 google 的 case 进行打分,每个 case 让 4 个人评,取平均值,总共评 1000 个 case
类似这样的对比,每周做一次,然后不断的更新自己的策略进行改进,如果你看到 baidu 的结果经过一段时间后能够超过 google 的结果,你信么?
如果你的工作就是做排序,你肯定能发现 google 也有许多脑残的 case。虽然不可否认 google 的系统优势很明显,但是搜索好坏已经不是单纯的技术因素了,百度的产品每天针对用户的喜好做优化,很难不在一些 case 上做得比 google 好。
切莫总是以专业人士的角度看世界。
各有千秋,虽然 Google 好多地方比百度厉害。
比如新版的百度学术功能很赞!!!
在中国百度肯定秒杀谷歌,在全球来说谷歌秒杀百度,为啥,因为我们中国人喜欢用百度?不是,因为谷歌被屏蔽了
为什么大家一直纠结在百度和谷歌的比较上呢?因为这两个其实是没有可比性的。搜索引擎在架构上都是一样的:爬虫(用于抓取网页 / 或者其他的 meta 信息 / 可以有一些 Oauth 的信息内容),index(进行索引),语言模块(前端的语言模块一般对进行语言级别上的处理:分词,语义等方面)。
因为我们进行的搜素其实是前端的语言模块(搜索请求)与数据索引模块(后端索引数据库查询结果)完成一次匹配以后展示在页面上的结果,但是每一次展示实际上是运用了 Rank 算法得出来的结果,百度和谷歌的差别就在这里,但是我认为这个其实不是什么要紧的东西,因为没一个搜索引擎最大的差别就是排序是不是与搜索请求最相关的(谷歌在除了中文以外的其他语言上好一些,百度在与中文相关的娱乐八卦 / 新闻。。。具有中国特色性的搜索请求上高一些),没一个搜索引擎都有一定的 | 偏好 |,这个偏好在所有的搜索引擎都是存在的(yahoo,bing,google,baidu,yadex,naver… 都有),所以说真是基于这样的考虑我感觉没有必要把谷歌和百度进行比较,因为实在没有什么意思。如果你的搜索请求集中在中文的娱乐 / 新闻 / mp3 等上面,那就选择百度好了如果其他的请求那就选择谷歌好了!!希望大家拍砖!
搜索相对与百度现在其实唯一的东西,谷歌有很多其他的项目那是另外一会事情,谁让谷歌自己爱好这些东西呢?!百度所有的战略就如同 Robin Li 一样:专注。如果百度要搞其他的项目的话也是可以的,只不过这样的道路不是很适合百度罢了!
搜索中结果的展示能不能添加其他的信息,比如与关键字查询相关的地理位置的判断?与关键字相关的知识图谱的展示等等问题都是再重新做一个知识库吧了,这个知识库可能很大,但是相信百度和谷歌都是可以做的,以前清华大学的 keg 实验室就做过一个相关的知识库给中国移动和搜狗公司使用。
我认为搜索还有另外的一个影响因素就是:跨语言搜索,比如一个查询请求:驴包(LV),因为这样的一个名字是一个昵称,但是这个品牌的包在英语世界和法语世界有着更加详尽的解释和说明,仅仅用中文进行搜索请求时是不能完全的解决我们想要查询的词语的背后的意思的,这个不知道有没有搜索引擎公司解决过呢?
随着移动互联网的发展,搜索肯定发生了很大的变化,比如基于 LBS 技术的推荐啊,基于机器学习技术的图像和语音的识别等等都是最关键的,现在搜索如何继续的玩下去其实还是一个没有解决的问题。
不管怎样的发展人们对信息的需求都是一直存在的,但是不同的时期需要不同的搜索确实随着技术和时代的发展一直在不断的变化(PS:信息检索和图书馆的方式还是非常接近的,哈哈!)
问这个问题的前提是 “你会翻墙”。
你要不会,百度和谷歌的区别与你何干,反正谷歌不能用。
你要会,百度和谷歌的区别与你何干,反正都能用。
至于技术的先进与否,这么说吧,如果哪天世界统一了,政府因为政策和 xx 原因要求所有互联网公司都关闭,只允许谷歌开,但是这件事对普通人保密。那么你真的会永远不知道这件事。
因为谷歌在互联网技术上的成就,用 “以一个公司的实力 copy 地球” 这个评价也不为过。
但是我还是喜欢用百度,因为中国人的用户习惯和环境问题。
别说人工智能了,刚在贴吧关注了一个吧,结果进去,关注按钮又是可点的,要自己手动刷新
vista 系统 搜狗浏览器 就这都做不好,还做人工智能,笑话。
百度的人工智能垃圾一样的
但是 google 相对我们来说就像不存在一样,被剥夺参赛资格。希望百度早日倒台
卖假药的怎么和研究量子计算机的相提并论?
认可但不认同,第一大环境不同,简单来说就是接地气,想搜的谷歌不一定搜出来但百度能,他适应了中国国情,具体啥国情就不方便说了。第二,最简单的国际化,又有几个人能认同区域性企业和成熟国际化企业能比?第三,业务切合度,搜索又不单是谷歌一个业务,机器人业务,安卓业务他不好整个在一起,但是百度是一家以搜索为核心,贴吧,mp3,图片等为依托的互联网企业,所以在搜索内容和实用性方面,百度更胜一筹,第四,资源,要是百度是在美国发家的企业,谷歌搜索那比的上?资源那比的上?第五,量级问题,这就不是个问题,数据之类才用量级,一家主营业务和一家核心业务相比,~。~也太看的起谷歌了,说到底,百度搜索更加便捷,但谷歌技术性太高了!正如毛主席所说的一个政策: 农村包围城市,以历史来看百度搜索君临全球只是时间问题。而这个时间就看人的,历史的洪流只有先行者能看出。
纯文科生,不懂技术。有人说百度中文分词技术好,我倒真没发现好在哪里。
百度搜索重磅推出 “鸿雁计划”,原来专门针对站长的!
原标题:百度推出的 “鸿雁计划” 到底有什么用?对站长有哪些影响?
先来看看百度发布的 “鸿雁计划” 到底是什么?
为了更好的提升百度 APP 搜索用户体验,百度搜索强力出击,重磅推出 “鸿雁计划”,联通百度搜索用户和开发者,助力开发者快速了解真实的搜索用户需求,提升用户满意度。
针对百度 APP 用户在使用百度搜索过程中遇到的问题,比如内容违规 / 违法、内容侵犯个人 / 企业隐私、内容涉及错误信息、页面质量不满足需求、操作功能异常等,“鸿雁计划” 会通过百度搜索资源平台 –【互动交流】-,在第一时间同步给网站开发者。
建议网站开发者及时关注和处理【搜索用户建议】专区的用户反馈问题和建议。同时,为了保障搜索用户满意度和浏览体验,对于多次被投诉且未及时处理的资源或网站,百度搜索可能会对其进行限制搜索展现的处理。
古有 “飞鸽” 传书,今有 “鸿雁” 计划。百度搜索 “鸿雁计划” 诚邀广大搜索用户的加入,助力全网开发者,共同建设更简单、更便捷、更有温度的百度搜索。
如何处理搜索用户反馈问题和建议?您可以参考《搜索用户建议专区上线公告》相关操作介绍。
【搜索用户建议】专区
以上就是 “鸿雁计划” 的官方解释,那我们来深度剖析一下,百度出这个计划到底是为了什么?
这个计划的有一点值得注意,古有 “飞鸽” 传书,今有 “鸿雁” 计划,那么鸿雁对应的就是飞鸽,那古代的飞鸽起什么作用呢?主要就是快递传递信息。那么百度出这个鸿雁计划目的也就是把信息快递传递过去。
以前一般反馈问题直接提交百度,那么让百度介入,那么现在百度做的直接就是用户和开发者直接对话,百度直接是旁观者,如果多次被投诉,百度才会干预。
那么我们来还原整个场景,比如,A 用户在百度 APP 搜索某个词进入网站,发现某网站有问题,然后提交反馈后,就会被百度同步到【搜索用户建议】专区,然后网站负责人 B 看到后整改,如果长时间不整改,就可能被百度限制搜索展现。
那么我自己做了一下测试,在百度 APP 中,我针对某个网站提交了某个举报 / 反馈,然后这条记录会展现到【搜索用户建议】专区,那么该网站的负责人能看到,然后进行整改。
完整的用户行为路径是这样的,但是这里有几个问题:
[百度搜索重磅推出 “鸿雁计划”,原来专门针对站长的! – 运营正经说www.yyzjs.cn
](https://link.zhihu.com/?target=https%3A//www.yyzjs.cn/zhanzhang/356.html)
已然没加限定就应该拿北美未阉割的 google 和天朝的 baidu 比… 然后结果很明显…
贡献两个例子:
我想搜 俩俩相忘, 但是忘了歌名. 只记得 原唱和剧中小昭的名字.
我想搜 idea 主题的网站啊, 百度给的都是修改主题..
不论想搜索哪里,都能建议去肛肠医院,百度这算法高级不
我来替百度说两句(看样子只能这样了),知乎多是高端客户,但百度做的主要是低端需求。走群众路线的百度满足不了知乎用户装逼需要,所以要优雅地谅解。。。
一个探寻人类的上限 一个挑战人类的下限
一直用 http://www.baigoogledu.com/
1. 屏蔽掉不必要的广告
2. 修改引擎参数后可以设置显示默认搜索 100 条的信息
3. 两栏同时显示,获取信息效率很高
一个做推广的,一个做搜索的,根本不是一回事好不
=========================
google 的广告和百度的广告区别,看下图,同样搜索【肝病】:
百度虽然在企业规模,技术水平,科研成果,财力,员工等方面要远弱于谷歌,但能把中文搜索做得好用方便就很 nice 了,也没法去和 Google 比,百度是围绕搜索业务这一入口绑入各种服务,谷歌是切入各大领域建立壁垒。感觉有些人赞谷歌骂百度,只是为了显得逼格高
如果说百度技术简单,为什么国内没有出现一家可以打败百度的搜索引擎公司? 其实这是一个经济学问题。
跑个题,针对一下楼上有些人用工程师思维来衡量数学公式……
比如一个简单的算平方根,那些些人用的是 sqrt() 这个函数,这个函数给完全没有编程知识,连 Excel 都没用过的人来看,他根本不知道这是什么,而百度考虑到这个情况,所以,他没有针对这个函数对结果做优化。百度在搜索结果优化上更倾向于口语,比如 2 的平方根我们会读成根号 2 而不是 s-q-r-t - 括号 - 2 - 括号。
根据结果给出的式子,我们套用这个格式来计算复杂一点的试试。
所以不是百度的搜索渣,而是你根本不是大部分用户的思维,在优化上你的优先级是非常低的。
首先是时间问题,Google 的搜索引擎是在 1998 年搭建的。而百度是李彦宏于 2000 年创立的。可以说百度搜索引擎的理念和雏形是从 Google 上搬运过去大陆的。
关于搜索引擎的工作原理:
这是 Google 比较简单易懂的算法
1、分析关键词
2、配对与关键词相关的资源
3、根据相似度排列
4、联系关键词的上下结构关系
5、回馈给用户
URL: https://www.google.com/search/howsearchworks/algorithms/
其次就是搜索引擎里的网络爬虫(搜索引擎在万维网里的网页中抓取脚本及关键词用来匹配从而反馈给用户的一种工具)
百度只扒 GFW 以内的网络资源。谷歌是按照用户设定的语言与地区来匹配搜索结果的,范围涵盖全球(除中国大陆以及其他偏远地区)
文化低不知道这个字怎么读, 于是就….
单纯的觉得一个互联网搜索引擎和一个局域网搜索引擎量级差距不会小。
知乎用户 Clairad 发表 十五年前: 搜衣服,上百度,搜家电,上百度,搜动画,上百度,搜知识,上百度,搜视频,上百度,搜八卦,上百度,搜音乐,上百度…… 现在: 搜衣服,上淘宝,搜家电,上京东,搜动画,上 B 站,搜知识,上知乎,搜视 …
知乎用户 ytytytyt 发表 恩, 在时间线上总算看到有人愿意为百度洗地或者说是为百度正面评价了,这值得表扬,虽然这水平还是不够。 既然不能光反驳的话,那我就一边反驳 @甄昊元的洗回答,一边穿插回答题主的问题。 先说观点:反对甄昊元文中 …
知乎用户 熊辰炎 发表 百度的衰落和谷歌退出有必然联系。 知乎用户 章辰 发表 百度的产品其实算半搜索半内容,比如新闻、贴吧、知道、文库、百科和网盘这些~ 在互联网早期国内还没什么内容(搜不出好结果)的时候,Ta 们为广大网民提供了(生产 …
知乎用户 ytytytyt 发表 本文以知识共享 署名 - 相同方式共享 3.0 协议发布,转载请署名并以相同方式共享。 部分内容来自微信 作者:差评 百度市值蒸发了 100 亿,为什么我们这么开心呢?因为,他太流氓了 **积善之家,必有余 …
知乎用户 alex 发表 2017 年最后更新 之前的内容被举报折叠,算了,我贴一个网易科技对百度流氓行径的深刻分析 百度旗下网站被指暗藏恶意代码 疯狂收割流量 知乎用户 怡见灼灼 发表 我最近在帮一个小妹妹研究高考填志愿,却意外发现了一些 …