http://www.dapper.net/

Dapper是一個「以視覺化使用介面讓User可以在任意網頁中選取自己想要的內容,為選取的內容即時產生一個RSS Feed以便訂閱」的網站。輸出的格式除了RSS Feed,也可以輸出成Google Gadget, Netvibes Module等,基本上還滿方便的。

全視覺化的操作介面,還滿容易上手的,分享一下操作步驟。

  1. 首先註冊、登入Dapper之後,可以進行搜尋的動作,或是「Create a New Dapp」。
  2. 選擇Create a New Dapp,並輸入想要的網址,在此以「丁丁大站」的本日熱門相簿為例。下面的輸出格式用RSS Feed。(當然也可以選用其他格式方便在其他地方使用。)
  3. 接下來會進入「Dapp Factory」,畫面中間的頁框可以看到剛剛輸入網址的內容,直接點選「Add to Basket」,並點選「Next Step」(此時它會出現建議你多輸入幾個網址以利比對,不理它直接繼續。)
  4. 點選後會進行分析頁面的動作,完成之後移動滑鼠游標,會發現滑鼠經過熱門相簿中的每個部位都會被反白,這便是讓我們開始製作RSS feed的重要步驟了。
  5. 點選縮圖的部份,會出現在「Preview selected content」裡面,再選擇「Save Field」便可定義這個項目的名稱。
  6. 再點選User名稱、儲存到Content Field,再下一步便完成了這個RSS Feed的產生。(不過顯然以丁丁大站的網頁來說,大概是沒有每個Element都有命名,因此分析出來的網頁會抓到我們不想要的部份,但90%都還算ok了。至於有沒有什麼調整方法我就沒去研究了,不想花時間在丁丁大站上,如果是自己寫程式抓丁丁大站,我也懶得研究,直接把regex丟進去,出來的結果砍掉抓錯的部份就好了XD)

要注意的是,Test Dapp會在24小時內被刪除。

以下是廢話分隔線

今天逛到Dapper這個很妙的站,突然讓我想起以前也曾經有這種念頭:「某些網站因為是比較早期推出加上又沒有在跟著Web上的流行,因此沒有RSS Feed這種可以讓user輕鬆地得知網站有無更新。要是有個軟體可以讓我框選某些網頁的特定內容,這個軟體以後就自動去幫我檢查該段落有無更新,那有多好?」

當時我不太懂資訊技術,很直觀地想就是去判斷某個網頁的全部、或某個局部有無更新(也許是每天比對一次),要是發現今天的網頁跟昨天不一樣,那「或許」就是內容有更新。這樣的作法有幾個問題,以整個網頁作為比較標的,那會因為某些動態產生的資料,例如廣告、時間、訪客計數器等改變;那要如何抓到網頁的「局部」?以前我沒有DOM的概念,不知道其實可以用Element ID或是CSS Selector的方式去抓到局部的內容。

如今,Dapper應該就是實現如此概念的一個好網站,網站的介面跟流程都還算容易上手,某些網站的內容特別有用,但卻沒提供RSS Feed便可以輕鬆為它加上RSS Feed,再用自己的RSS Aggregator去訂閱自製出來的RSS即可。此外,Dapper產生的RSS Feed是可以塞變數的,換句話說,如果你的資料來源網址中有類似index.php?id=deduce&page=3的參數,是可以指定變數讓Dapper產生不同的RSS Feed的。

講到圖形化介面來製作RSS Feed很容易讓人聯想到Yahoo! Pipes,不過其實我認為Yahoo! Pipes是以RSS Feed為主要資料來源(雖然它也是可以由別的網頁Fetch Data),而Dapper則是替使用者動態產生RSS Feed。