健保資料庫釋憲案宣判部分違憲-第一線經驗談

「健保資料庫,最近大法官宣布部分違憲,這事你怎看?」
「衛福部防守機制已經算很嚴格了。」
「喔!所以你對衛福部還挺讚賞的?」
「並沒有,問題在於它有收費啊…結果軟體還是落後三個版本以上……」

大法官衡量個人隱私與公共利益後所做的裁決:「健保資料庫釋憲案宣判部分違憲,現今雖仍可使用健保資料進行學術研究,但3年內須建立獨立監督機制維護個人隱私,讓民眾可請求退出」一事,的確是當今社會遲早要權衡的一大議題。

此案的發展,可能關乎到所有政府行政資料的後續使用,將是國家推行數據治理的里程碑與轉捩點。

以第一線資料處理的使用經驗來看,要能接觸到健保資料並不容易,大多數是教學醫院或是受各級機關委託研究的學術單位,且團隊成員除了要有與研究議題相關的專長外,還要了解健保資料庫,並具備大數據處理及分析的能力。

就營利為導向的數據公司角度而言,考量健保資料的規模與複雜性、發包單位要求的數據處理(分析等級)、需花費的時間,和最重要的是…能提供的預算……,能長期支撐這些研究的,也只有那些具有研究熱忱的醫生教授、學習為導向的研究生,和有評鑑壓力的各級單位了(笑)。

且健保資料也並非這些單位想使用就使用,仍然要經過一系列重重審核和行政程序,如:

計畫書審核:非必要使用健保資料的研究不予通過。
資料申請審核:非與研究議題高度相關檔案/欄位不予提供。
入場人員審核:確實為計劃內編制人員,且簽署相關保密切結書。
資料攜出入審核:具有個資相關資訊,及統計分群人數太少的圖表全部不予攜出等。

「統計分群人數太少不能攜出?」
「對啊……」
「但總會用到一些分類展開,一定會有人數比較少的分類啊?」
「對啊……」
「所以攜出的時候審核人員會把這些人數太少的分群做合併?」
「說啥笑,你自己併啊!還審核人員幫你併勒!你沒併就不能攜出!」
「靠!那不是增加我工作負擔嗎?」
「所以我上面才寫…..有研究熱忱的……」
「是是,我懂你意思了……」

此外,在實際使用相關資料時,進場使用資料的人員也受到高度監管:
1. 電子門禁:進出場都要刷卡。
2. 禁帶物品:除了衣著和腦袋之外,禁止帶任何物品進場,更別說電子用品或USB隨身碟。
3. 斷網環境:忘記語法怎麼寫,資料室可沒有google大神能救你,只能出資料室去使用網路。
4. 無法攜入任何文件資料:沒辦法預寫處理語法或沿用他案的語法再帶進去。
5. 無法攜出任何未申請通過資料:即使真的需要紙筆,也僅能由監管人員提供,出場後統一回收無法帶走。
6. 所能看到的資料皆已去識別化:這點在所有政府部會算是很一致的作法。

在申請攜出方面,不得不說衛幅部「想得很周到」,除了一般的統計報表外,還需提供產製這些統計報表的程式碼,並且由會使用該統計軟體的人員來進行審核,如果審核人無法理解程式碼,甚至會直接打電話請申請人解釋。

「不只要你煮的菜,還要你繳交食譜?」
「然後煮不出來你還得教他怎麼煮。」

從以上可知,如果要偷帶資料,難度非常高,要有雨人般超級記憶力才行。

但縱有天生神力,衛福部資料科學中心的真正大魔王是任誰都無法擊敗的:電腦數不足、軟體數不足、電腦效能問題。不論是電腦數還是軟體數,都不及需求數量,每每到了預約時間,預約系統就會當機,即使發現還有空的電腦可申請,也極有可能發現想用的軟體都被預約完了……。

幸運地入場之後,也要馬上開始與時間戰鬥,因為每次入場都是至少幾千塊的費用,半天要收費、全天要收費、夜間執行要收費、假日執行要收費……,每當程式寫錯中斷執行,就是又一次的浪費預約和無效益預算。

以第一線使用人員來看……(筆者絕對不承認就是筆者自己)……大部分的腦內劇場應該是:案子都要做不完了還預約不到電腦!因為電腦容量的關係,所以把一個檔案拆成了三個檔案,但還是跑不出來!一個檔案就跑不動了,還要串三個不同的檔案來跑,真的會來不及啦!一旦去了資料中心就要耗上一天的時間,其他事情都不用做了!都收了這麼多錢了,為什麼不能多買幾套軟體!多用效能好一點的硬體配置!拜託程式千萬不要出錯,經費沒辦法這樣花啊!

撇除個人小劇場不提,回歸一般民眾的個人隱私和國家行政資料的使用議題。衛福部的資安審核得算蠻嚴苛的了,一線團隊要做的事情也很多,要有時間和心思弄些有的沒的實在不容易,且研究人員不論是在初期資料處理,以及最終統計報表產出時,能使用的資料皆已去識別化,或是已排除了分群人數過少的統計表了。

最重要的是,進行這些研究分析真的需要熱誠,以營利的角度而言實在划不來,如果沒有評鑑和升等的需求,說不定連現有願意做這件事的人數都會大幅降低。

在資安攻防中,經常會提到的,當少數族群/弱勢團體的資料被不斷串接後,其實很容易藉著各個資訊推敲出「實際上到底指的是哪個人」,雖然不可否認這件事的邏輯沒錯,但實際上有能力處理資料的人和認識這些族群的人機率上很難是同一位,兩者因為專業落差的關係,對話起來也常常是平行時空,能夠兩邊能都不出錯,又還要一起合作提出完整的研究報告申請,簡直難如登天。以我們第一線資料處理人員的角度,幾乎無法想像從這樣的資料,要能直接推敲到某一個具體的民眾身份。

退一萬步來看,縱使真以某份資料推敲出了一個民眾身分,然後登門拜訪,這個動作基本已經違反個資法了。因此事情不該從「能否100%防範」去看,而應該從「法律上是否已規範完善」的角度出發。畢竟再嚴密的資安控管,都避免不了有心人士的犯罪手法。只能盡量以「當不遵守規範時,就已違法、且有罰則」的方向去處理這樣的問題。

「話說……勞保局、財稅中心要不要跟進釋憲啊?」
「但人家沒收錢啊!」

資料使用的「安全」與「便利」,永遠是天秤的兩端,如何拿捏分寸,在不影響到特定民眾隱私的條件下,將資料價值發揮到最大,還有賴有熱忱的專家學者們,共同討論,逐步完善相關法律及規範。期待某一天,我們都能既安全又有效率地使用公共資料。