Yahoo正在向世界提供一關鍵的內部技術 – Vespa
據媒體報道,雅虎Verizon擁有的母公司 Oath公司正在免費發布其最重要的內部軟件,該公司長期以來曾經提出建議,定位廣告和執行搜索。
消息稱,雅虎有一款名為Vespa的內部工具,用於內容推薦,廣告投放和執行某些搜索。
Vespa可以說是雅虎自2009年Hadoop以來最大的開源軟件版本,它成為兩家現在上市公司Hortonworks和Cloudera的基礎。像亞馬遜,Facebook和Google這樣的公司可能會發現它很有用。
Vespa軟件解決了一個常見但令人驚訝的困難問題:例如將文本輸入框時,快速找出響應輸入顯示用戶的內容。 據悉,現在有大約150個應用程序中使用它,其中包括Flickr,Yahoo Mail和主要的Yahoo搜索引擎(專門針對組件,如實體,本地結果,圖像和問題的答案),它每天處理30億個原生廣告請求。
“典型的情況是你不知道你想要什麼,但是你有200億張照片,你想找到正確的照片。”雅培創始人杰弗遜的領導者傑布·布拉特塞特(Jon Bratseth)在接受采訪時對CNBC進行了採訪。
Vespa現在在GitHub上使用Apache 2.0開源許可證,可以輕鬆地添加到不同的應用程序中,使其適合在像亞馬遜,Facebook和Google這樣的大公司使用,需要對不同的集合進行不同種類的數據處理。
雅虎過往亦放出自己的技術,好像在2006年開放了Hadoop大數據軟件的代碼。Hadoop已經成為兩家上市公司Cloudera和雅虎分拆的Hortonworks之使用技術。 今天,許多公司的人們可以為雅虎仍然廣泛使用的技術做出貢獻,並使用Hadoop構建自己的系統。
雅虎如何建立它
大型科技公司定期開源軟件。 但是,如果強大的軟件是公司最大收入中心的核心,那麼可能需要一段時間才能開放,Vespa也沒有什麼不同。
維斯帕可以追溯到21世紀初。 雅虎已經擁有網絡搜索技術,首先通過與Google的合作,之後通過其2002年Inktomi收購。 雅虎沒有的技術是提供搜索結果的技術和關於超出傳統網頁搜索結果的內容的建議。
2003年,雅虎收購了Overture,其中包括其合作夥伴AltaVista以及名為AllTheWeb.com的知名搜索引擎。交易完成後,大約30名AllTheWeb人員獲得了一年的時間來構建可以在向最終用戶顯示網頁之前快速執行某些功能的軟件。該系統還需要易於設置,運行和調整,使其可以無縫地應用於各種應用。
2005年左右,AllTheWeb團隊與雅虎購物團隊合作採用新系統。它需要較少的管理時間,釋放員工建立新功能。
Vespa架構概述圖:
“之後,我們有一個經過驗證的用例 – 這是一個複雜的案例,”Bratseth說。 “雅虎的越來越多的團隊自己開始使用我們的系統,因為它有商業意義,他們會卸下很多他們自己照顧的問題。”
所以Bratseth的團隊開始擴大維斯帕的權力。他們使得它能夠處理除用戶的文本字符串之外的輸入;隨著時間的推移,它也可以根據用戶以前點擊的內容來個性化內容,這在用戶沒有輸入任何內容的情況下是有價值的。他們也改變了Vespa,從而可以從機器學習算法中獲取方向。
在過去五年中,位於挪威特隆赫姆市的維斯帕集團已經通過了代碼並重寫了不同的部分,使整個事情更好地工作,布拉特謝說。
他們還有更多的工作要做 – 他們正在尋求將Vespa與TensFlow(Google領先的開源人工智能軟件框架)進行深度整合。
Source: Yahoo
Yahoo distinguished architect Jon Bratseth.
上週Bratseth在加州的 Oath總部接受訪問時,他遇到了來自雅虎Flurry部門的人員。他們希望開始使用Vespa,因為他們相信可以為創造收入提供新的功能:讓移動應用程序製造商開始運行可以推廣自己的產品的“內部廣告”。
曾經在雅虎工作了九年的軟件工程總監Poola Sreenivas問Bratseth,今天仍然在 Oath的All TheWeb員工中有一個 – 如果有辦法看到Vespa需要花費多長時間它的東西因為在網絡規模上,消費者每隔一毫秒就要等待事情。
Vespa可以掛鉤 Oath內部監控軟件,Bratseth表示,但它也有一種連接第三方監控工具的方法。 “所以你可以做出指標等等,”Bratseth說。
現在, Oath之外的人們可以按照自己的願望使用代碼,並從製作人的幫助中獲得幫助。
[完]
對於以上消息,各位298電腦讀者又怎看呢?
歡迎到我們的<<討論區>>分享你的意見。
灣仔298電腦資訊網
免費網上電腦雜誌,電腦IT人集中地!
網址:www.wanchai298.com