blog.Ring.idv.tw

News

Cloudera - 專門針對Hadoop技術支援的公司

Cloudera.一間提供Hadoop相關支援服務的新公司~ 而且裡面盡是一些大ㄎㄚ.. @@" 光看學歷就夠嚇人了,有Stanford、Harvard、Washington、Berkeley和Cambridge,在現在這個時候開一間這樣的公司~ 果然前景看好,因為太熱門了呀!!

其中Christophe Bisciglia在今年年初還有來台灣舉辦Google Cluster Computing Workshop,不過他剛離開Google了~ = ="

還有Tom White,正在寫「Hadoop: The Definitive Guide」這本書籍... XDD

我如果能進去打雜就算不錯了吧~ 哈!

2008-10-22 02:55:39 | Add Comment

Instapaper - 網頁暫存器

不曉得大家有沒有像我一樣這類的需求~

我有使用Google Reader的習慣~ 而每天開啟時會先關注感興趣的文章~ 然後一一地在瀏覽器開新分頁來閱讀~

但是如果當下沒有時間來得及看完~ 而又不想將它儲存在書籤中,通常我的作法就是直接關閉Firefox,然後點選「儲存並離開」~ 這樣下次啟動Firefox時就還會一一出現在分頁中~ 不過這樣的作法有一個缺點~ 就是這些網頁只儲存在這台電腦上的Firefox之中~

所以~ Instapaper 可以解決這樣的問題~ 而且又不需要安裝額外的外掛~ 重點在於我超喜歡它的整個設計~ 完全的專注於需求面,又相當簡單易用!!很讚的UI設計 ^^b (所以今天在公司將它前端程式研究了一下~ ^^)

你只要將它所提供的「Read Later」加入到你的書籤中,然後在你想「稍後閱讀」的網頁中,點一下你加入的「Read Later」書籤,它就會自動地將這個網頁加到你的「稍後閱讀」清單~ 接下來不管身處何地都可以來進行閱讀嚕~

2008-10-15 00:57:45 | Add Comment

Microsoft BrowseRank vs. Google PageRank

Microsoft tries to one-up Google PageRank.剛剛看到的一則消息~

文中主要描述微軟亞洲研究院在SIGIR'08 Conference發表了一篇名為「BrowseRank: Letting Web Users Vote for Page Importance」的論文~

論文中有提到一些Google PageRank演算法的毛病~ 譬如:我們可以惡意地建立許多連結到我們自身擁有的網站,以提高網站的PR值分數~ 而另一個則是它並沒有考慮到使用者在瀏覽其網站時所花費的時間~

所以這篇論文希望能以「User Behavior Data」來評估網站的重要性~ 舉一個例子:為何PageRank針對adobe官方網站的重要性有那麼高的PR值?因為許多網站都有提供Flash Player或Acrobat Reader的連結~ 但.並非代表人們常去瀏覽adobe網站~

那「User Behavior Data」該如何取得?論文提到兩種方式~ 一種是利用類似Web Server的Log file方式來取得,另一種則是安裝Browser plug-in來記錄~ 而記錄的類型主要分為「Input」(網址列輸入)和「Click」(超連結)~

至於論文中所提到的BrowseRank演算法細節~ 呃... 我就看嘸嚕... XDDD

不過不可抹滅的~ Google所為人稱道的PageRank演算法,仍然為全世界的網頁帶來重要性的排序~

可見微軟多麼地大力想要多吃點搜尋引擎市場~ 雖然還買不下Yahoo! Search,但至少已花了1億美元買下Powerset...

2008-07-25 21:25:11 | Add Comment

Yahoo! Open Hack Day in Taiwan

今天得知的新聞~ Yahoo! 全球技術長Aristotle Balogh(亞里斯多德?蠻帥的名字~)來台講述「Y!OS」計畫~

並預計九月會在台灣舉辦一個「Open Hack Day」的創意競賽~ 從「Wiki - Hack Day」得知~ 應該是組一個團隊並利用Yahoo!所提供的API或Open Source Library做出一個創意產品~ XDDD

相關新聞

Yahoo 全球技術長 Aristotle Balogh 媒體座談會

Yahoo!全球技術長出馬 首度與台媒談「開放」

Yahoo!大開放 成社交化平台

雅虎全球CTO:我們將解開社交網路的枷鎖

2008-07-03 18:48:05 | Add Comment

Adobe Advances Rich Media Search on the Web

今天.Adobe發了一則新聞稿「Adobe Advances Rich Media Search on the Web」,內容在強調Adobe和Google、Yahoo!一同合作,針對檢索Flash動畫的困難來加以改善~

主要的目的就是希望能藉由目前主流的搜尋引擎「Google」和「Yahoo!」的力量,來讓檢索Flash動畫能更加容易與精準~

如果你熟悉SEO(Search Engine Optimization)領域的話~ 絕大多數都會建議你開發整個網站時,儘量避免使用Flash動畫技術來製作整個網站~

然而~ 在現在多媒體數位時代~ 整個網站以Flash動畫技術來製作是不可或缺的了~ 尤其是電影官方網站之類的~ 絕對需要整合影像、影音、互動程式來完成~

而且從另一個角度來看~ 在Flex愈來愈普及的情況之下~ 整個以Flash動畫技術來達成的RIA也是潮流~ 所以~ 對於該如何檢索Flash動畫技術就顯得格外重要~ 當然,這也是我最主要的研究方向~

而且根據Google的這篇po文「Improved Flash indexing」所描述的,目前他們遇到三個需要克服的技術問題如下:

1.

Googlebot does not execute some types of JavaScript. So if your web page loads a Flash file via JavaScript, 
Google may not be aware of that Flash file, in which case it will not be indexed.

這一點的確有技術上的問題~ 就算Googlebot包含JavaScript直譯器來處理這樣的問題~ 那反而要顧慮到效能、安全等等議題~ 所以,我想這一點應該由網站設計人員來解決~ 將網頁的原始碼包含embed這樣的tag,並明確地描述Flash動畫所在的位置。

2.

We currently do not attach content from external resources that are loaded by your Flash files. 
If your Flash file loads an HTML file, an XML file, another SWF file, etc., 
Google will separately index that resource, but it will not yet be considered to be part of the content in your Flash file.

這樣的問題就在於我們通常會將一個以Flash動畫為主的網站,然後會將部份內容切割成一個個的SWF檔案,有需要時再將它用載入的方式運作,但這對於Googlebot來說就是一個大問題了~ 就算Googlebot認識SWF File Format~ 它也還要從這SWF檔案之中去發掘任何可能從外部載入的資源,所以這也就成為我碩士論文主要想改善的問題~ 不過時至今日.Adobe也提供了一個專門的技術來改善這部份的問題~ 而且「感覺上」好像比我的方法有效率...(因為人家是Adobe~XD) 不過就像上面所說的~ 抓到的這些資源該如何判斷這是屬於Flash動畫的一部份... 還有許多東西無法一言以敝之... 留待有機會再談。

3.

While we are able to index Flash in almost all of the languages found on the web, 
currently there are difficulties with Flash content written in bidirectional languages. 
Until this is fixed, we will be unable to index Hebrew language or Arabic language content from Flash files.

很顯然地,這就是文字編碼的問題,因為在Flash 6版本之前並不支援Unicode,就算支援~ 如果使用者仍然執意要使用平台上的預設編碼,那還是會遇到諸如此類的問題~ 這部份也是我未來積極地想要解決的問題之一。

綜而觀之.Adobe如此的舉動我覺得對於Flash動畫在推廣上一定有加強的效果,但就看Google和Yahoo!誰能做的比較好~ (還是我呢?XDDD 期許吧~) 總之不管是誰~ 我想這對於整個Flash動畫環境都是好的~ Google和Yahoo!加油吧~ 我也是~ XDDD

相關資源

Ryan Stewart - Finally, Flash Becomes Truly Searchable

Chad Egeland - Adobe Flash Now Google Friendly

SWF searchability FAQ

CNET - Uncloaking 'invisible' Flash Web content

InfoQ - Flash Content Now Searchable

Google Now Crawling and Indexing Flash Content

Best uses of Flash

Peter Elst - Thoughts on Fully Searchable Flash

2008-07-01 23:02:44 | Add Comment

Next Posts~:::~Previous Posts
Copyright (C) Ching-Shen Chen. All rights reserved.

::: 搜尋 :::

::: 分類 :::

::: Ads :::

::: 最新文章 :::

::: 最新回應 :::

::: 訂閱 :::

Atom feed
Atom Comment