開放資料的最佳定義為:可取得的公開資料,讓人們、公司,以及組織可用以創立新事業、分析型態與趨勢、做出資料導向決策,以及解決複雜問題。
它們是有使命的的資料,是開放、免費、透明的資料,這些資料可以改變企業經營、政府運作、管理種種交易的方式。開放資料是一種”民主”的概念,政府應該將蒐集到的資料開放給付錢納稅人。除了給社會帶來益處,開放資料也創造了龐大的商機。
舉例來說,臺北市長柯文哲在這個月初成立了”北市道路管線暨資訊中心”,把台北43個管線權管單位集中起來,透過集中管控、全面監控。這樣的資料庫建制完成後,可以明確知道電力、瓦斯、自來水、下水道的管線位置、深度、種類等資訊。私人業者如台灣大哥大、中華電信也能進駐道管中心,協同建立精確的資料庫。
開放資料和大數據非常不同。大數據涉及處理非常大的資料,以及辨識出資料中的型態與關聯性。要做到這點,要靠強大的電腦和便宜的資料儲存系統來儲存及分析資料。
我們生活中產生的 data exhaust,例如我們手機的GPS位置、信用卡購買紀錄、Google的搜尋紀錄….等,都是餵給大數據”研磨”的穀物。大數據的資料來源大致是被動的,通常是不公開地,這些資料的產生沒有目的、沒有方向,甚至大家會忘了自己正在生產它們。使用大數據的公司與組織通常基於商業或安全理由,不會公開這些資烙。
開放資料則是公開、有目的、刻意釋出的資料,任何人皆能取得、分析、使用。開放資料的釋出通常是基於特定目的,例如想促進研發、激發新事業的創立、改善大眾健康與安全…等等。
儘管開放資料與大數據並不相同,還是有部分重疊之處。當他們重疊時,效果可能非常強大。一些政府機構已經開放巨量的資料,已創造出顯著的經濟效益。開放資料一方面和大數據有關連,另一方面則和開放政府運動(Open Government movement)有關。
開放資料帶來的四大前景
- 熱門創業
- 投資的工具與服務
- 行銷策略
- 快速創新
潛在的熱門創業
有些公司聰明地使用開放資料,因此快速的發展。譬如結合GPS和地理位置資料,打造出受歡迎的App:Google Maps, Google earth, Foursqure,Uber,Instagram,Evernote,Waze….等。
智能信息披露指的是結合政府資料、公司的產品與服務資訊,以及消費者相關資料,為消費者做出個人化的購買決策。這類產品有如選擇引擎(choice engine)。舉例來說,Kayak找便宜機票,找房子超好用的網站Zillow,個人理財Mint.com,選學校GreatSchools.org …等。
有些野心勃勃的新創公司,試圖成為政府開放資料的中介者,就像DataMarker和Import.io 。不過目前最熱門的新創公司應該是Enigma.io,它可能成為開放資料領域最受矚目的企業之一,它把多个国家的開放數據整合索引,提供搜尋服務。
精明投資的工具與服務
2012年起,美國證管會要求在美國證交所掛牌、且符合特定會計標準的八千多家公司必須使用XBRL(可延伸商業報告語言)提供部分的年報跟季報。XBRL電腦語言使用一種電子標籤,將大量標準化、可比較的公司財報績效數字與文字資訊關聯化,每家公司使用一萬一千個標籤來敘述其事業經營績效資訊。所有使用XBRL格式申報的資料,都是可供大眾使用的開放資料。
一家名為Capital Cube的公司開發分析全球四萬多家公開賞識公司的軟體,天天更新這些公司的資料,把數字資料自動轉化為目前交易狀況的說明,並提供工具,用以比較不同產業不同公司的風險與報酬前景。
一些投資資訊供應商,例如Marketwatch.com,現在開始追蹤分析師的”情緒”,以做為一種市場動向指標。若你對此方法感興趣,可以去PsychSignal網站看看。
聰明行銷策略
除了作網站跟成立Facebook粉絲團,現在經營企業還要考慮到”聲譽資料”!! 因為你的客戶們會創造出強而有力的開放資料 – Ptt上的鄉民、mobile01的宅宅們,verywed的女人們,都會貼出各式各樣的抱怨文、開箱文、比較文給全世界觀看。
聰明的公司現正學習探勘跟了解這些資料,並做出回應,也利用他們來建立或強化品牌。新創公司PublikDemand為消費者提供申訴平台,他的老闆告訴企業,你可以把消費者的抱怨轉成優勢。他們倡導一種名為「社群媒體客服」(social customer service)的方法,幫助公司藉由公開回應對民眾的申訴來改善商譽。
另一個行銷武器叫做「情緒意見分析」,它把大量的消費者意見轉化成可以量化的商業情報。無論是消費者對產品或服務的評價,或是相關的部落格文章,都能變成開放資料,形成所有網路使用者的集體意識資料集。
情緒意見分析從社群媒體取得資料,聚焦在帶有正面或負面情緒的字眼。要得到最佳的分析結果,需要人與機器的結合,只靠電腦運算還不夠。如果運用的好,除了幫助你了解顧客,還能了解你的企業,哪些部分營運的好? 哪些部份需要改進?
新型式的快速創新
透過開放資料,一種新形式的群眾外包(crowdsourcing)正在形成,幫助研究型公司找出解決方案。一個名為citizen science的計劃,計畫號召上百萬名志願者協助分析與精煉資料,為私人企業建構模型。
開放資料也助長了開放式創新 — 一種全新的科學研究方法。科學家和研究人員提早且公開分享他們的資料,以促進其他實驗室通力合作。在開放式創新的模式下,以往保密的資料被拿出來分享。這和過去科學及藥品研究的文化背道而馳,但這種模式的成效非常卓著,可能是一種新的事業模式,例如製藥業巨人GlaxoSmithKline正在嘗試使用開放式創新來提高生產力。
http://data.fingal.ie/Blog/November2012/Name,36164,en.aspx |
美國政府提供的開放資料
美國政府目前暫住許多研討會、活動和挑戰,以鼓勵使用聯邦資料,以下是依些最好的資訊來源:
- 白宮部落格 www.whitehouse.gov/blog
- 白宮科技政策辦公室 www.whitehouse.gov/administration/eop/blog
- 開放政府倡議 www.whitehouse.gov/open/blog
- 報導聯邦政府科技議題的線上刊物 fedscoop.com
- 連結政府與科技界的 InformationWeek
www.informationweek.com/government.asp - Challenge.gov
針對保健領域,衛生與公眾服務不提供了一些資料取得管道,以及如何使用這些資料的訣竅。
- HealthData.gov
- 聯邦醫療保險與醫療補助服務中心 CMS.gov
- Medicare.gov
- 健康資料聯盟 www.healthdataconsortium.org
還有兩個資訊源頭可幫助尋求使用政府開放資料來發展新應用和創立新事業者
- GitHub上的開放資料專案 (Project Open Data : project-open-data.github.io ),幫助軟體開發者了解並使用聯邦開放資料的資源。
- 應用程式開發者聯盟( Application Developers Alliance : appdevelopersalliance.org ),支持應用程式開發者使用開放資料,並為他們代言。