【資料單元識別】 DataElementIdentifier
【辭書名稱】圖書館學與資訊科學大辭典
資料單元識別是美國國家標準局(AmericanNationalStandardsInstitue,簡稱ANSI)所研擬的第Z39號標準中,針對書目資料在計算機的表達、儲存與通訊標準的一個專有名詞。
在這分標準草案中,書目資料的表達共分成7個層級。
分別是:第0層:訊息邊界(MessageBoundaries)第1層:資料結構(DataStructure)第2層:資料單元識別(DataElementIdentifier)第3層:資料單元值(DataElementValues)第4層:顯示格式(DisplayFormat)第5層:媒體(Media)第6層:媒體集(HousingofMedia)這7個層級由小而大,形成完整的書目資料階層架構。
資料單元識別是整個書目資料階層架構的第2層,主要是用來區別資料單元的屬性,特別是用來辨別第1層資料結構的內容所設計。
資料單元的識別有隱式(Implicity)與顯式(Explicity)兩種設計的作法。
隱式識別法是在整段資料訊息(Message)中,利用資料間的相對位置來區別資料的不同;
而顯式的作法則是利用不同的符號或名稱來區別。
資料單元識別也使用於中國機讀編目格式(ChineseMARCFormat)之中。
中國機讀編目格式是根據國際標準組織第2709號標準(ISO2709)所制訂,並以各欄位、指標、分欄識別、代碼等說明磁帶上書目紀錄之內容。
其中分欄識別(SubfieldIdentifier)即為資料單元識別。
所謂資料單元識別是指機讀編目格式資料欄中,由兩個符號組成,用以識別各欄位中不同分欄。
第1個符號為國際標準組織ISO646符號集IS之「$」符號,第2個符號則為數字或字母。
因此,在中國機讀編目格式中,凡是看到「$1」「$a」均代表是資料單元識別。
由於中國機讀編目格式的資料單元識別,是採用不同的符號作為分欄識別,因此屬於顯示的作法。
採用顯式資料單元識別的作法,將有助於資料庫中變長欄位的使用:由於書目資料的欄位長度變化頗大,為使機讀編目格式能廣泛運用於各單位,以處理各種不同語言文字的書目資料。
因此,其設計必須採用手雙長欄位的設計。
如此將使得機讀編目格式在從事書目資料的運作上,無論是書目資料的儲存、轉載、交換或更動上,將更富有彈性。
這也是為什麼中國機讀編目格式中,變長欄位占有相當多個數的因素之一。
轉自:http://edic.nict.gov.tw/cgi-bin/tudic/gsweb.cgi?o=ddictionary
|