古籍校雠机读模式初探-兼论中国文化研究所「汉达文库」的另类功能_第1页
古籍校雠机读模式初探-兼论中国文化研究所「汉达文库」的另类功能_第2页
古籍校雠机读模式初探-兼论中国文化研究所「汉达文库」的另类功能_第3页
古籍校雠机读模式初探-兼论中国文化研究所「汉达文库」的另类功能_第4页
古籍校雠机读模式初探-兼论中国文化研究所「汉达文库」的另类功能_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、PAGE PAGE 10古籍校讎機讀模式初探兼論中國文化研究所漢達文庫的另類功能香港中文大學中國文化研究所何志華引言太平御覽卷六一八引西漢劉向別錄謂讎校,一人讀書,校其上下,得誤繆為校一人持本,一人讀書,若怨家相對,故曰讎也。誠如劉向所言,校書過程嚴謹,古人校書,反覆勘察,校其異同。至於讎者,則兩人對面而坐,一人誦讀,一人聆聽,終日相對,才能完成。時至今日,各地學術機構紛紛建立古籍資料庫,校讎學者得電腦之助,可以在彈指之間蒐集異文,考其異同,古籍校讎學已然開展了嶄新的局面。事實上,在科學技術日新月異的今天,陳垣於校勘學釋例卷六所提校法四例,我們已可利用電腦的記憶、搜尋、對比、連結等功能,初步進

2、行古籍對校、本校及他校的程序。本文嘗試就古籍校讎的機讀模式,以香港中文大學中國文化研究所所建漢達文庫為例,探討如何利用古籍電腦化資料庫進行文獻校勘工作,從而研究利用電腦進行古籍校讎工作的可行性及其規限問題。一機讀模式文獻校讎工作之對校工序:劉向校讎古籍,就曾蒐集同一本書的不同版本,互為對勘,以見其同異。陳垣校勘學釋例校法四例的第一例即為對校法,陳垣說:以同書之祖本或別本對讀,遇不同之處,則註於其旁。 見陳垣校勘學釋例,北京:中華書局出版,1959年。頁144。另蔣伯潛校讎目錄學纂要亦有相近論點,蔣氏說:劉向校書先備許多不同的底本所以無論那一種本子,都不能保其全無錯誤。如只據一種本子,至多只能對

3、它發生懷疑,覺得難解。必與另外的本子相讎校,然後能發現它底衍奪錯誤在甚麼地方,而加以刪補釐正。 見蔣伯潛校讎目錄學纂要,北京:北京大學出版社,1990年。頁87。倘以機讀模式,利用古籍電腦化資料庫,就我國古籍文獻進行校讎工作,必先就資料庫所據的底本素質考量。今天,各地學術機構紛紛建立古籍資料庫,而資料庫所據底本亦多為善本。然而,並非所有資料庫都有採用對校法比對同一文獻的不同版本的。誠如陳垣所言:凡校一書,必須先用對校法,然後再用其他校法,又以為有非對校決不知其誤者,有知其誤,非對校無以知為何誤者。 見陳垣校勘學釋例,頁144。 據此可知,對校法於文獻校讎學至為重要。現今處理古籍電腦化資料庫,就

4、所謂對校法而言,其實已包含了嶄新的理念。本文以為今天古籍電腦化資料庫之對校工序,至少應該分成兩個層面進行,今試以香港中文大學中國文化研究所建立之漢達文庫為例,概略論之:1.1 文獻錄入依據版本與別本的對校程序:香港中文大學中國文化研究所建立之漢達文庫,目的並非僅僅在於將傳世及出土文獻資料,從書本形態轉變為機讀形態,而旨在有系統地對傳世文獻及出土文獻進行整理工作。以傳世文獻淮南子為例,在輸入文獻工作之前,研究人員都仔細比較同一文獻的不同版本,選擇其中舊刻善本又未經後人擅意改動的。經初步比對後,資料庫決定採用劉泖生影鈔北宋本淮南子(臺北:藝文印書館,1974年),亦即四部叢刊本作為文本錄入的依據。

5、北宋本淮南子嚮稱善本,每能保留淮南原來面貌。漢達文庫所收淮南子既以舊刻善本即四部叢刊本為依,而此本又未經後人校改,當中底本原來的訛誤是可以想見的。因此,漢達文庫在選定底本後,由研究人員就文獻錄入依據的四部叢刊本,選取其他重要版本進行全面校勘比對工作,並盡量記錄其他版本所見異文。以淮南子為例,資料庫就曾比對了下述四種不同版本:淮南子,臺北藝文印書館1974年影鈔北宋本。道藏本淮南子,道藏要籍選刊第五冊,上海古籍出版社1989年版。劉績本淮南子,明弘治王溥刻本。莊逵吉本淮南子,二十二子本,先知出版社影光緒二年浙江書局校刊本。又參考了前人學者有關淮南之校勘成果合共三十二種。 漢達古文獻資料庫淮南子之

6、編纂,曾參考下述文獻:包括1.錢塘淮南天文訓補注2.王念孫讀書雜志3.王引之經義述聞4.孫詒讓札迻5.劉台拱劉氏遺書6.劉文典淮南鴻烈集解7.楊樹達淮南子證聞8.俞樾諸子平議9.王叔岷淮南子斠證(上)10.王叔岷淮南子斠證(下)11.王叔岷淮南子斠證補遺12.王叔岷淮南子斠證續補13.于大成淮南鴻烈原道校閱14.于大成淮南鴻烈俶真校釋15.于大成淮南鴻烈天文校釋16.于大成淮南鴻烈地形校釋17.于大成淮南鴻烈覽冥校釋18.于大成淮南鴻烈精神校釋19.于大成淮南鴻烈本經校釋20.于大成淮南鴻烈主術校釋21.于大成淮南鴻烈齊俗校釋22.于大成淮南鴻烈氾論校釋23.于大成淮南鴻烈詮言校釋24.于大成

7、淮南鴻烈兵略校釋25.于大成淮南鴻烈說山校釋26.于大成淮南鴻烈說林校釋27.于大成淮南鴻烈人間校釋28.于大成淮南鴻烈脩務校釋29.于大成淮南鴻烈要略校釋30.于大成淮南子校釋31.劉殿爵三國吳諱鉤沉32.鄭良樹淮南子斠理。 研究人員參照不同版本淮南子,以及清朝以來學者於淮南一書之校讎成果,將別本所見異文及前人之重要論說,加以詳細注錄,對北宋本淮南子進行了有系統的文獻整理工作,並校正底本中明顯之誤字。凡經校改之處,均加上校改符號,以求建立原始文獻資料庫。此為古籍校勘一般採用之對校法工序。此一工序之採用,可以有助資料庫讀者在檢閱一書之主要版本時,同時掌握其他別本的異文,學者可以據此比較各本異同

8、,論其優劣,並推敲文本內容思想。1.2 文獻錄入依據本從書本形態轉化為機讀形態的對校工序:時至今日,學術機構建立古籍電腦化資料庫,只靠上述對校方法,顯然並不足夠。古籍電腦化資料庫之建立,旨在將傳世文獻資料,從書本形態轉變為機讀形態兩種形態之轉換,必然導致文獻出現某種程度之失真,研究機構得採取相應措施,盡量減少失真程度。以傳世文獻淮南子為例,劉泖生影鈔的北宋本淮南子,亦即四部叢刊本,乃學術界公認之淮南善本,每能保留淮南原來面貌。然而,倘若研究機構在處理文本從書本形態轉換為機讀形態時稍一不慎,對善本文獻的研究價值就會帶來嚴重的影響。且讓我舉一例加以說明。北宋本淮南子原道云:圖一 欲之心亡於中,則飢

9、虎可尾,何況狗馬之類乎! 是肉字的異文,在傳世文獻中是比較罕見的。淮南子的大意是:如果我們內心裏沒有吃掉對方的肉的心,那麼即使我們把弄餓虎的尾巴也沒有危險,何況是狗馬一類比較善良的動物呢?清代著名文獻校勘學者王念孫(1744-1832)在未能得見北宋本淮南子以前,看到的淮南文本此章多作欲害之心或欲寅之心,王念孫不以為然。他細心比對不同資料,認定欲害之心或欲寅之心當作欲之心,有關論說可見於他的讀書雜志。 王念孫云:欲寅之心,寅當為,字之誤也。與肉同,欲肉者,欲食肉也。諸本及莊本皆作欲害之心,害亦之誤。文子道原篇亦誤作害。劉績注云:古肉字。則劉本作可知,而今本亦作害,蓋世人多見害少見,故傳寫皆誤也

10、。(見王念孫讀書雜志淮南子第一江蘇:古籍出版社,1985年,總頁765。) 今天,所有傳世的淮南子,就只有北宋本是作的,恰與王念孫論說相合,可證王說精妙獨到。我們依據北宋本淮南子作為電腦化資料庫的底本,就可以保留欲之心這一句彌足珍貴的文獻材料。然而,選定了古籍善本作為文獻錄入依據,並不代表資料庫就信而有徵。研究機構將善本文獻從書本形態轉化為機讀形態的對校工序仍得謹慎為之,方能避免錯誤。北京書同文數字化技術有限公司製作的四部叢刊電子資料庫,宣稱其淮南子之輸入依據底本,乃為北京大學圖書館藏上海涵芬樓影印四部叢刊本,四部叢刊電子資料庫同時收錄文本原文圖象(即書本形態,見圖一)及對應釋文(即機讀形態,

11、見圖二),但檢索四部叢刊電子資料庫的淮南子原道訓,卻發現原文的欲之心,在轉變為機讀形態時,被誤讀為欲害之心。圖二: 此字之被誤讀為害,就恰好證明古籍資料庫從書本形態轉變為機讀形態工序之難,稍一不慎,錯誤難免。二機讀模式文獻校讎工作之他校程序上文已曾討論機讀模式文獻校讎學,在對校法上要注意之問題。現再嘗試就陳垣校法四例中他校法之機讀模式問題,以漢達文庫為例加以分析。陳垣說他校法者,以他書校本書。凡其書有采自前人者,可以前人之書校之有為後人所引者,可以後人之書校之其史料有為同時之書並載者,可以同時之書校之。 見陳垣校勘學釋例,頁146。依據上文所論,漢達文庫在建庫之工序上,已然採用了兩重對校法,因

12、而符合了文獻校讎的基本要求,從而可以進一步探求以機讀模式進行他校工序之可能性。陳垣謂其書凡有採自前人、後人或同時者,可以前人之書、後人之書及同時之書校之。現試從先秦兩漢所見互見文獻,及唐宋類書引文兩方面,概述漢達文庫近年在機讀文獻他校之嘗試。2.1 互見文獻陳垣所謂有一書內容又見前人之書、後人之書、同時之書者,其實與先秦兩漢的文獻傳承情況相合。眾所周知,先秦兩漢傳世文獻常有多書內容重複互見的情況。清人陳士珂於二百年前,已曾全面研究韓詩外傳內容與其他古籍互見重出之情況。他利用人手將韓詩外傳逐章鈔錄,再憑個人記憶所及,臚列與韓詩外傳出現相近內容之先秦兩漢文獻資料,發現傳世本韓詩外傳二百九十章中,有

13、七成內容亦見於其他古籍,可見古籍內容互見重出,固先秦兩漢文獻之習見現象。陳士珂將其研究成果,編纂成韓詩外傳疏證,以供後人參考。同年,陳士珂亦編纂孔子家語疏證,時至今日,兩書仍廣為流傳。由此可見,古籍互見重出內容之對比研究,意義重大,影響深邃。1999年,漢達文庫嘗試利用電腦進行先秦兩漢傳世文獻之重複互見現象的研究,開發機讀文獻互見內容自動搜尋程式。該系統專為互見文獻的資料處理而設計,研究工作包括三項主要程序資料庫設置程序;互見文獻重複內容之配對程序;互見文獻確認程序。在資料庫設置程序中,系統會自動讀取先秦兩漢文獻的資料檔案,同時將文獻資料分割為句子單位,並同時列明該等句子的相關資料。這些相關資

14、料包括書名、卷數、節數和行數。然後,系統將此等句子,按年代、書目儲存於預設之表格內。當啟動互見文獻重複內容配對程序後,系統將利用一項自動配對程式,自行搜尋先秦兩漢文獻資料庫,將資料庫內容相近之句子編入獨立組別,並存放於結果資料表中。最後一項為互見文獻確認程序。系統將搜尋所得互見文獻配對結果加以整理,研究人員即可通過輸入書名、卷數、節數或關鍵字詞以搜尋上述互見文獻配對結果資料,運用專業之古文獻研究知識,判斷上述搜尋結果所得書證是否成立。互見文獻內容配對互見文獻重複內容配對程序互見文獻內容配對互見文獻重複內容配對程序否是研究人員確認結果研究人員輸入進行檢定之文獻名稱互見文獻配對結果顯示資料庫設置程

15、序研究人員互見文獻檢定程序完成開始將結果存放在結果資料表內將每種文獻句子存放在獨立的資料表內匯集所有獨立資料表,存放於書籍資料表中將文獻資料劃分為句子單位讀取文獻檔案利用上述工作程序,漢達文庫已完成先秦兩漢古籍所見相關內容之確認工作,並已將初步之研究成果發放於互聯網上。此項研究計劃之長遠目標有二:蒐集先秦兩漢一切傳世古籍互見文獻之資料,並以電腦化的形式清楚列示,俾使學者能夠清楚掌握互見文獻之情況;利用蒐集所得之互見文獻資料,探究古代文獻之傳承關係,從而比對、校勘今本,考其異同,校訂訛誤。舉例來說,利用上述程式,學者可以選取不同年代之不同文獻,查詢該文獻可有互見文獻。舉例而言,學者可以在彈指之間

16、比對孔子家語、說苑所見重複出現之文獻內容A.孔子家語觀思孔子自衛反魯,息駕於河梁而觀焉。有懸水三十仞,圜流九十里,魚鱉不能道,黿鼉不能居。有一丈夫,方將厲之。孔子使人涯止之,曰:此懸水三十仞,圜流九十里,魚鱉、黿鼉不能居也,意者難可濟也。丈夫不以措意,遂度而出。孔子問之曰:子巧乎?有道術乎?所以能入而出者何也?丈夫對曰:始吾之入也,先以忠信;及吾之出也,又從以忠信。措吾軀於波流,而吾不敢以用私,所以能入而復出也。孔子謂弟子曰:二三子識之!水且猶可以忠信成身親之,而況於人乎?B.說苑雜言孔子觀於呂梁,懸水四十仞,環流九十里,魚鱉不能過,黿鼉不敢居。有一丈夫方將涉之,孔子使人並崖而止之曰:此懸水四

17、十仞,圜流九十里,魚鱉不敢過,黿鼉不敢居,意者難可濟也。丈夫不以錯意,遂渡而出。孔子問:子巧乎?且有道術乎?所以能入而出者何也?丈夫對曰:始吾入,先以忠信,吾之出也,又從以忠信。錯吾軀於波流,而吾不敢用私,吾所以能入而復出也。孔子謂弟子曰:水而尚可以忠信義久而身親之,況於人乎!系統可以按段落顯示互見文獻資料,亦可按上下兩行之模式直接並排對照互見文獻,將比對結果清楚顯示讀者可以據此推斷兩書之間近義詞之使用情況。以上一組家語說苑互見文獻為例,學者可以蒐集其中之近義字:孔子家語觀思:有一丈夫,方將厲之。說苑雜言:有一丈夫方將涉之。據漢語大字典,厲可解作涉深水,也可泛指涉水、渡水。相關用例可參考詩邶風

18、匏有苦葉:匏有苦葉,濟有深涉。深則厲,淺則揭。毛傳:以衣涉水為厲,謂由帶以上也。又涉解作行走,相關用例可以參考尚書君牙:心之憂危,若蹈虎尾,涉于春冰。孔傳:春冰畏陷。可見厲涉兩字義近。依據互見文獻比對結果,我們亦可得知古籍通假字之使用情況。舉例而言,學者通過比對孔子家語問玉與荀子法行之互見內容,可以探求古書通假字之使用情況孔子家語問玉:叩之,其聲清越而長,其終則絀然,樂也。荀子法行 :扣之,其聲清揚而遠聞,其止輟然,辭也。據唐作藩上古音手冊,絀與輟分別為物部透母入聲字和月部端母入聲字。又據高亨古字通假會典,絀與輟古書通用例證甚多,可見兩字確然具有通假字之關係。系統以上下兩行並排對照的模式,將互

19、見文獻之比對結果清楚顯示,讀者可以據此推斷兩書之間近義字、通假字之使用情況。由此,學者可以借助電腦,以機讀模式完成部分文獻對校工序,從而了解先秦兩漢不同文獻中所見互見重出之內容,通過對照、比勘,進一步推斷古書的承傳情況。2.2 類書引文陳垣所謂他校法者,有謂凡其書有為後人所引者,可以後人之書校之。考中國唐宋年間編纂之傳統類書,乃為前人匯集當時傳世文獻資料,依類區分,重新排列編纂之典籍。唐、宋兩朝,編纂類書蔚然成風,著名類書如北堂書鈔、初學記、藝文類聚、太平御覽等相繼編成。類書廣泛引錄古籍內容,凡此皆屬陳垣所謂後人引書之例。然而,傳世類書資料浩如煙海,依靠個別學者之努力,難以全面董理類書資料。漢

20、達文庫於2000年已開展中國傳統類書資料庫研究計劃,旨在全面整理傳世類書,建立完整之類書電子資料庫,其目的有二建立一完整之類書電子資料庫,方便學者探求不同朝代、不同類書之編纂方法將類書引文與傳世文獻文本進行對比研究,探求類書引文與傳世文本之異同。類書計劃將收錄由魏晉六朝至明清的主要類書,諸如群書治要、冊府元龜等皆在收錄之列,預計資料庫總字數將超過六千萬字。 同時,輸入類書文獻皆據舊刻善本,再由研究人員重新校勘凡經校改之處,均加上校改符號,俾便學者知道底本原貌。當類書資料庫完成後,漢達文庫即可利用電腦程式將類書引文,與資料庫內收錄之傳世文獻進行機讀模式之對比,從而為學術界提供嶄新古代文獻對校功能

21、。 三機讀模式文獻校讎工作之本校程序考證之學,重在以經證經,也就是所謂的本證法。陳垣的校勘學釋例卷六論校書之法,當中舉出本校法本校法者,以本書前後互證,而抉摘其異同,則知其中之謬誤。 見陳垣校勘學釋例,頁145。有關文獻本校法,其實可以上述機讀模式之他校法進行。在同一書內,利用互見文獻配對程式,於不同章節之間進行搜尋及配對程序,可以成功檢得可供本校使用之文獻材料此等資料源出同一文獻,校讎工作遂不必借助別本。事實上,本校乃對校以外,另一種重要之校讎方法,在校勘學上功效極大。本校法之運用,對資料庫錄入文獻所據版本有嚴格規限,倘若資料庫使用文本並非原始版本,又或曾經後人改動者,皆不宜使用本校法。漢達

22、文庫所收入文獻資料悉數採用舊刻本,多能保持古籍原來面貌,因符合本校法之要求。漢達文庫通過互見文獻配對程序,可以檢得一書之中,有前後出現而內容相彷者多例,今舉呂氏春秋長見與呂氏春秋觀表同書互見之例說明長見:吳起治西河之外,王錯譖之於魏武侯,武侯使人召之。觀表:吳起治西河之外,王錯譖之於魏武侯,武侯使人召之。長見:吳起至於岸門,止車而望西河,泣數行而下。觀表:吳起至於岸門,止車而休,望西河,泣數行而下。長見:其僕謂吳起曰:竊觀公之意,視釋天下若釋,觀表:其僕謂之曰:竊觀公之志,視舍天下若舍屣。長見:今去西河而泣,何也?吳起抿泣而應之曰:子不識。觀表:今去西河而泣,何也?吳起雪泣而應之曰:子弗識也。

23、利用電腦就同書互見內容進行比對,可以借助電腦記憶、檢索的功能,大幅提升文獻本校程序的工作效率。四機讀模式文獻校讎之困難:4.1 電腦現階段無法進行理校法陳垣在校法四例裏說段玉裁曰:校書之難,非照本改字不訛不漏之難,定其是非之難。所謂理校法也。遇無古本可據,或數本互異,而無所適從之時,則須用此法。此法須通識為之,否則鹵莽滅裂,以不誤為誤,而糾紛愈甚矣。故最高妙者此法,最危險者亦此法。 見陳垣校勘學釋例,頁148。理校法於校勘學而言最為複雜,亦最為高妙,因而亦最難成功。理校之用,非長時間浸淫古籍校理之學,具備通讀古籍文句之能力,實無法運用。電腦雖然具備強大記憶體,然而,在缺乏其他文本進行對比的情況下,現階段電腦仍難以自行判斷古籍文句是否有錯,機讀文獻校讎工作之最大局限亦在於此。4.2 電腦對讀古籍時,難以識別通假字機讀文獻校讎工作之另一局限,則在於電腦不能有系統地識別古書之通假字。因而在

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论