【資料單元識別】

豐碩 · 發表於 2012-11-28 23:59:33

【資料單元識別】

DataElementIdentifier

【辭書名稱】圖書館學與資訊科學大辭典

資料單元識別是美國國家標準局（AmericanNationalStandardsInstitue，簡稱ANSI）所研擬的第Z39號標準中，針對書目資料在計算機的表達、儲存與通訊標準的一個專有名詞。

在這分標準草案中，書目資料的表達共分成7個層級。

分別是：第0層：訊息邊界(MessageBoundaries)第1層：資料結構(DataStructure)第2層：資料單元識別(DataElementIdentifier)第3層：資料單元值(DataElementValues)第4層：顯示格式(DisplayFormat)第5層：媒體(Media)第6層：媒體集(HousingofMedia)這7個層級由小而大，形成完整的書目資料階層架構。

資料單元識別是整個書目資料階層架構的第2層，主要是用來區別資料單元的屬性，特別是用來辨別第1層資料結構的內容所設計。

資料單元的識別有隱式(Implicity)與顯式(Explicity)兩種設計的作法。

隱式識別法是在整段資料訊息(Message)中，利用資料間的相對位置來區別資料的不同；

而顯式的作法則是利用不同的符號或名稱來區別。

資料單元識別也使用於中國機讀編目格式(ChineseMARCFormat)之中。

中國機讀編目格式是根據國際標準組織第2709號標準(ISO2709)所制訂，並以各欄位、指標、分欄識別、代碼等說明磁帶上書目紀錄之內容。

其中分欄識別(SubfieldIdentifier)即為資料單元識別。

所謂資料單元識別是指機讀編目格式資料欄中，由兩個符號組成，用以識別各欄位中不同分欄。

第1個符號為國際標準組織ISO646符號集IS之「$」符號，第2個符號則為數字或字母。

因此，在中國機讀編目格式中，凡是看到「$1」「$a」均代表是資料單元識別。

由於中國機讀編目格式的資料單元識別，是採用不同的符號作為分欄識別，因此屬於顯示的作法。

採用顯式資料單元識別的作法，將有助於資料庫中變長欄位的使用：由於書目資料的欄位長度變化頗大，為使機讀編目格式能廣泛運用於各單位，以處理各種不同語言文字的書目資料。

因此，其設計必須採用手雙長欄位的設計。

如此將使得機讀編目格式在從事書目資料的運作上，無論是書目資料的儲存、轉載、交換或更動上，將更富有彈性。

這也是為什麼中國機讀編目格式中，變長欄位占有相當多個數的因素之一。

轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary

		自動登錄	找回密碼
密碼			【立即註冊】

【資料單元識別】

評分