時間:2016-7-10(星期日) 10:00-12:30
主講者:李正賢(臺北市政府資訊局)
地點:國立臺灣大學電機二館143教室
撰稿:葉奕辰、王睿英
攝影:王睿英
講者提供的簡報檔案

Open Data工作坊是由臺北市政府資訊局、臺北市政府產業發展局及台大黑客松合作的活動。本次工作坊分上下兩場演講,分別介紹臺北市政府的開放資料應用和實作,以及臺北市政府公開的各種創業資源。本文將針對與開放資料相關的演講內容進行介紹和討論。本場演講係由臺北市政府資訊局李正賢先生,說明開放資料的概念及如何應用臺北市政府所提供的開放資料進行相關應用。以下分述講者提及的開放資料概念、市政府開放資料平台及其應用:

 

開放資料=公開免費自由下載 + 機器可讀程式

提到開放資料(Open Data),不少人可能會聯想到各類不同主題的統計資料或年報,但問起開放資料到底是什麼,究竟「開放」了什麼,可能很多人就答不出來,得要動動手去網路上Google一下。Open Definition將「開放資料」定義為一種可以被任何人自由使用、重製和散布的資料。由這個定義看來,開放資料的開放指的應該是使用上不受授權限制的開放性。然而,從本工作坊李正賢先生的講座中,我們可以發現,除了囊括上述的定義外,李正賢先生還指出了另一個關鍵,即資料格式對機器或程式的可讀性也是開放資料中相當重要的要素。這背後的思維與全球資訊網發明者Tim Berners-Lee提出的開放資料五顆星的分類架構相當類似,強調的都是格式的開放性。也就是說,開放資料除了可為人自由使用與重製,也必須符合開放格式。因此,開放資料有別於政府的公開資料(未必符合開放性格式)。

李正賢先生指出,過往,政府機關公開資料的檔案格式時常是Word、Excel,甚至是紙本掃描的PDF檔。這些發布格式雖然能能夠滿足大眾知的權利,提供基本的瀏覽和使用,但由於這些格式中的資料並沒有經過適當的編輯與處理,程式不容易理解每一筆數據的意義,使得進行複雜的分析或程式應用時,還得經過特殊的處理才能使用。這進而使需要跨多種資料、資料數目龐大應用面臨許多困難,阻礙了大眾使用這些資料的便利性和可能性。開放資料想追求正是更近一步的除去種種阻礙,超越過去單純的資訊公開,以滿足大眾「用」的需求。

2016032_01圖1 李先生介紹如何使用台北市政府公車資料,可以見得其機讀性

 

臺北市政府開放資料平台及其應用:Data .Taipei

講座中,李正賢先生介紹到臺北市資訊局所建置的Data .Taipei。該平台整合了臺北市政府各局處的開放資料,省下跑遍各個局處網站找資料的麻煩。Data .Taipei上提供的資料集分為兩種:一種是各機關出版的刊物,其檔案類型多為PDF;另一種是各機關所提供的原始資料,檔案類型為XML、CSV等適合再利用的格式,多有提供介接API的服務,方便程式開發者所撰寫的程式能取得需要的資料。這兩種不同屬性的資料集各有各標準的詮釋資料(metadata)格式,如同圖書館館藏目錄中的書目資料,清楚地紀錄錄一筆筆資料集的重要描述資訊,如上次更新時間、負責機關的連絡資訊。Data .Taipei這個平台使過去四散各處的資料有更好的組織,並完整提供描述資料和更新脈絡,方便民眾近用,以取得最新最正確的資料。

2016032_02圖 2 Data .Taipei首頁截圖

而Data .Taipei所提供的資料集內容上,也不單只是過去聽到政府開放資料時會聯想到的政令宣導、就業資訊、流行病資訊等統計資料,在資訊透明化的想法下,臺北市政府提供更多如各捷運站間行駛時間、各道路即時的車流、速率或店家的食材登錄等資料供民眾取用。

然而,李正賢先生也強調,設立開放資料的搜尋平台之餘,更需要資料的分析處理和最後的包裝呈現,才能方便一般民眾使用。因此,近年來臺北市政府資訊局為了激發程式設計師對開放資料的各種應用,舉辦或協辦不少與開放資料相關的活動,像是臺北市政府開放資料黑客松、雲端即時開放資料服務(Taipei OMG , Taipei Open, Mobility, Green)及台大黑客松(HackNTU2016),目的都是希望能透過這些程式馬拉松,將開放資料推廣到民間,進而能被各界應用。這類黑客松活動有助產出更能為普羅大眾所使用的應用程式,如李正賢先生在演講中提到以臺北公眾區免費無線上網熱點資料為基礎產出的臺北WIFI熱點搜尋的APP,或是利用臺北市哺集乳室資料所製作的友善臺北哺乳室的APP。這些成果使得原先放在平台上的資訊,更能夠有效地被一般民眾利用。

上述開放資料的應用,除了使大量龐雜的資料變成一般民眾能輕鬆取用的程式之外,李正賢先生也提到,開放資料的使用有時也能提供政府單位意見反饋,進而協助施政決策、點出施政問題,或是針對開放資料內容提出需求或建議。協助決策方面,李正賢先生以臺北市公共運輸顯微鏡4D為例,說明這樣的應用結合了地圖,公車、捷運、火車、YouBike等資料,可以計算一個地點在一定搭乘時間內能夠到達的地區範圍,操作介面簡單易懂,能夠提供社會局在選擇社會福利機構設置地點時參考,確實掌握機構位置對於民眾的可及性。點出施政問題方面,如2015臺北市政府開放資料黑客松得獎作品公車之王參零柒即點出公車班次間距的諸多問題,我們觀察到,該作品透過資料視覺化分析307路線公車的班距,雖然發車和到達終點站的時間都依照表訂時間,但是尖峰時間民眾感覺到公車不來的時候,好長一段時間都不來,一來就是好幾班是真實存在的現象。這樣的作品能提供交通局規劃管理公車班次很好的參考。開放資料的使用不單單有益於民眾的日常生活決策,亦可作為政府施政決策的參考,提供政府面對諸多問題未來改進的方向,間接地使民眾的生活更美好。

 

結語

本次Open Data工作坊因著重於如何用運用工作站使用臺北市政府開放資料,目標聽眾為具有一定程式撰寫能力,但較不了解臺北市政府開放資料平台的程式開發者。因此,講者是從資訊工程的角度切入介紹開放資料,定義開放資料時,也強調開放資料的機讀性,使用上則以介接Data .Taipei資料集的作法為主,最後才提到開放資料的應用成果。雖然工作坊的內容中,有些細節對程式生手而言較難以理解,但是,工作坊所傳達如何藉由程式善用政府開放資料,相信能為聽眾夠帶來許多應用政府開放資料的靈感,也是邁向開發相關應用程式的第一步。如果聽過開放資料但「略懂略懂」,不曉得到底怎麼用,不妨去參加像Open Data工作坊這類推廣活動,並實際針對一個議題用開放資料動手做做看看吧!

 

其他參考資料:
The Open Data Handbook: http://opendatahandbook.org/
內政部國家發展委員會莊明芬於103年7月9日「政府資料開放現況與展望」的簡報:www.moi.gov.tw/files/moi_note_file/tcc_file_355.pdf


文章分類: 新聞報導