Music: Night
1.コンピュータと私
これをご覧になっている貴方は、当然コンピュータからこのサーバーへ接続して、今この画面を見ているはずであ
る。即ちコンピュータをお使いになっているはずだ。詳しい人も、そうでない人も、マウスを操作して Internet
explorer(或いはそれに代わるブラウザ)を動かして、「お気に入り」から「邪馬台国大研究」をクリックしてこ
こへきた。そのパソコンは、通称PC(ピーシー)と呼ばれるパーソナル・コンピュータのはずだ。
今年の夏帰省したら、弟が自作PCを作っていた。私に感化されて奴のPC歴も10年くらいにはなるだろうか。
もう7,8台買い換えているのではないだろうか。当初は私が教える立場だったのだが、今は逆転している。私の
セガレも、もう私には判らないPCの世界にのめり込んでいる。驚いたことに、弟は昔のVIDEOテープから映
像を取り込んで、DVDに変換していた。ソフトを使えば編集もできると言う。甥や姪達の運動会の映像に、突然
アンパンマンやバットマンを登場させたりできるのである。信じられない進歩振りだ。
最新型の Personal computerなるものがここまで一般社会に蔓延したのはここ30年である。ちょうど私の社会人生
活と重なっている。
私事だが、私は学校を卒業して日立製作所のコンピュータ関係の会社に就職した。そこには5年しか居なかったが、
その5年間で得た知識は、その後の25年間を支えている。私は大型コンピュータのオペレーターから始めてプロ
グラマー・SE(システムエンジニア)と進んだが、どうみても技術者とは言えず、営業の仕事へ代わりたかった。
私の書くプログラムの仕様書(設計書)は、仲間から「悪魔の仕様書」とか呼ばれていた。今の会社へ変わって営
業職になってからは、本社の経理部長から「大阪で一番交際費を使う井上君」とか呼ばれたりもした。
当時はPCなるものはまだ存在せず、1台200万円位するWORD-PRO(ワープロ)が全盛で、米国産の貿易用WORD
-PROなどは400万円もしていた。1,2年して、CP-MというOS(オーエス)を搭載したPCと、MS-DOSを搭載
したPCが登場し、ほどなくCP-Mは市場から姿を消していった。これはIBMが本格的にPC製造に乗り出し、そ
のOSにマイクロソフトのMS-DOSを採用した事が決定的な差を生んだ。私などは、OSとしてはCP-Mのほうが優れ
ていたように思うが、そういう意見を言う人は多い。MS-DOS は今やWindowsへ発展し、ビルゲイツはミリオネャー
となったが、CP-MとMS-DOSの明暗を分けたのは実にささいな事である。いつかNHKで放映していたのでご存じの
方も多いだろう。
IBMの担当者は、自社のPCに搭載するOSに、CP-Mを選ぶかMS-DOSを選ぶかで決めかねていて、それぞれの家
を訪問する事になった。いずれもまだ会社組織などではなく、自宅でソフトを開発していたのである。最初IBM
の担当者はCP-Mの開発者の家に行ったが留守で、奥さんもIMBをわからず、旦那に連絡を取ろうともしなかった。
そこで担当者達はビルゲイツの家を訪問し、ビルゲイツの説明を聞いてその場でMS-DOSに決めた。その時ビルゲイ
ツは億万長者に、CP-Mの開発者(もう名前も忘れた。)はただの人に運命が決まったと言える。後で考えると、私
が日立の会社に入社した当初の5年間で、その辺りがすべて決まっていたのだが、我々コンピュータのプロ(を目
指していた)人間達の間では、PCがここまでになると予想した人間は殆どいなかった。私の同僚などは「あんな
オモチャ、使いもんになるかい」と言っていたし、私も同様の考えだった。全く凡人は、いつまで経っても凡人で
ある。
2.コンピュータとは何か?
PCはパーソナル・コンピュータと呼ばれるので、大型コンピュータとはその仕組みや機能が違っているとお思い
の方がおられるかもしれないが、大型もPCもその動いている理屈(原理)は同じである。処理する能力と値段が
違うのだ。ここでPC初心者の方向けに、特別に「コンピュータ入門講座」を開催することにしよう。よくご存じ
の方、聴きたくも無いという方は、このコーナーはスキップして頂いて結構である。
コンピュータ入門へ
3.数理文献学
古代インドの文法家たちは、リグ・ヴェーダ(B.C.1500年頃に成立したバラモン教の教典)の、行、単語、音節の
数をくわしく数えている。また、紀元前3,4世紀頃、エジプトのアレクサンドリアの学者達は、ホメロスの詩に、
一度だけ現れることばの数を数えている。
しかし、このような試みが、ひとつの学問として体系化していくのは19世紀の後半に入ってからである。1867年、
スコットランドの古典学者カンベル(1830−1908:聖アンドルーズ大学教授)は、彼のいわゆる「統計的方法」に
よって、プラトンの諸著作の執筆時期の確定を行った。
プラトンの諸著作は、どれが初期に書かれたもので、どれが晩年に書かれたものであるか不明だった。その執筆順
序については、プラトンもその弟子達も、直接的な証拠をほとんど残していない。しかもプラトンは50年とも60年
とも言われる執筆活動の間に、多くの点で意見を変えており、執筆年代を考慮せずにプラトンの哲学の体系を理解
する事は不可能に近かった。そのため、プラトンの執筆時期については、さまざまな研究が行われた。しかし、キ
メ手となるものがなく、結論はマチマチであった。カンベルは、アリストテレスが大著「法律」をプラトンの最後
の著作としている事を手がかりに、稀出語の数などによって、各作品と「法律」との近さを測り、結局、プラトン
が老年になってから書いた作品の群として6つの対話篇を決定した。以後、19世紀から、第一次世界大戦のはじ
まる1914年ごろまでには、「統計的手法」によるプラトンの著作研究のいわば隆盛期であった。おもにドイツ
の学者により、20あまりの研究があいついで発表された。この時期に「数理文献学」の基礎が固まったと言って
よい。
<文献学とは>
原型に遡及する方法論は、西欧でのギリシャ・ローマの文献を取り扱う「古典文献学」に範を取っており、「文献
学( philology)」と呼ばれる。これは、書誌学とは違い、文献の正しい読みに基づいて、その成立した文化的状
況、又時代とともに受容されていった歴史、その影響した範囲、などを研究する。最初のステップは、一群と認め
られる現存写本を比較して、本来の語句を推定して本文を製定する作業であり、「本文批判」と呼ぶ。この為には、
写本群を共通性で整理分類し、系統を定めることが望ましい。この様なプロセスに、数理的手法が適用できる。
明治末から昭和初期にかけてドイツ文献学が輸入され、その系譜法が日本文献学の基礎となった。『源氏物語』に
大きな足跡を残した池田亀鑑は、昭和16年に「土佐日記」の紀貫之自筆蓮華王院本を復元する膨大な成果を公刊
し、併せて文献批判の一般論を展開した(『古典の批判的処置に関する研究』岩波書店)。この復元案は当初批判
もあったが、池田の死後、昭和五十九年になって「藤原為家自筆本」が見いだされ、池田案の精度の高さが確認さ
れた。但し、語句の共通性を元にして系統を決めていく系譜法は「土佐日記」の場合のようにうまく適用されると
は限らない。それは、写本Aを転写するときに、系統の異なる写本Bの語句をAの本文において入れ替えた文を作
り、それを書写して写本Cを作成するという、混態( contamination)が頻繁に起こるからである。これは、生物
の系統樹で言えば異なる属や科での雑種に相当し、写本Cの原型が何であったのかを推定する時に大きな障害とな
る。数理的手法でも、この混態は大変やっかいな問題である。
<文献解析学とは>
文献学に数理的手法を導入した分野を「数理文献学」と呼ぶ。シェクスピアはロジャー・ベーコンのペンネームか、
と疑われたとき、両者の文章の癖を統計的に検討して、別人であると結論された。これを「計量文献学」の始まり
とする。この場合、品詞の使用頻度など、文章を解体した統計数値を比較する。『源氏物語』の成立経過にも「計
量文献学」から成果が得られている。これに対して「文献解析学」とは、その典籍の構造を見ながら、多変量解析
のみならず、分岐学(cladistics)等も適用し、写本群の系統を推定する。また、混態のある写本群を処理するに
は、人工知能的な判断をコンピュータに行わせることも必要になってくる。
<矢野環(たまき)埼玉大学理学部数学科教授 専門分野 解析多様体の特異点、代数解析学、古典籍の文献
解析、茶花香道史>
1944年にはイギリスの統計学者ユール(1871−1952)の研究があらわれる。ユールは、イギリスの王立統計協
会の会長にもなった統計学会の重鎮である。ユールは「キリストにならいて」(イミタチオ・クリスチ)を取り上
げた。「光と命の書」とも言われたこの古典は、カトリック信者必読の書と言われ、西欧においては、バイブルに
ついで、もっとも多く読まれたといわれる。
「キリストにならいて」の著者については、古くから論争が絶えなかった。ある研究者は30人の人名をあげ、あ
る人は200人以上の名を挙げている。長い間の論争の末、著者として二人の人物の名前が浮かびあがってきた。
一人はオランダ・ドイツなど主としてゲルマン語系の国々で支持されたドイツの修道士トマス・ア・ケンピス
(1380−1429)であり、もうひとりはイタリア。フランスなど、ラテン語系の国々で支持されたジャン・ジェルソ
ン(1363−1429)である。この2つの説は、たがいに譲らず、邪馬台国論争と同じように、いつ果てるとも知れな
い有様であった。ユールは、厳密な分析を行い、たとえばトマスの他の文章との語との統計による相関係数が0.91
であるのに対して、ジェルソンの文章と「キリストにならいて」との相関係数が0.81にしかならないことなど、豊
富なデータを挙げて、洗練された統計的手法を用いてトマス説に軍配を挙げた。
第二次大戦後、数理文献学はさらに、発展をみせる。統計学、情報理論、判別関数法などの新しい統計数学が続々
と導入され、コンピュータの普及発展とあいまって、数理文献学は、欧米では飛躍的な発展期をむかえた。また統
計学者、数学者、情報科学者、心理学者、言語学者など、様々な分野の学者が、人間の書いたものを数量的に分析
することに興味を抱き、毎年数理文献学に関連する多くの論文が発表されるようになり、専門の学会も発足した。
<「卑弥呼と邪馬台国 −コンピュータが幻の王国と伝説の時代を解明する−」安本美典>
ここで、卑弥呼と邪馬台国との探究にあたって、私が、この本でとった方法についてのべておきたい。それは、ひ
とくちでのべるならぱ、数理文献学や、内容分析学の方法である。数理文献学については、拙著『数理歴史学』
(筑摩書房刊)のなかで、ややくわしく紹介したことがある。数理文献学は、文献中にあらわれる特定の語の頻度を
数えたり、種々の文体特徴を統計的、数理的分析し、それによって、文献の伝えている情報内容を、客観的に探究
する学問である。また、内容分析学とは、シカゴ大学社会科学教授のベレルソンによれば、「伝達内容を分析する
ための、客観的、体系的、数量的な方法である。」 内容分析の源の一つとして、 コミュニケーションについての
研究があげられる。これは、はじめ、アメリカの新聞の内容を研究するために、ジャーナリズム研究者によって用
いられた。のちには、主として、社会学者、社会心理学者の手によって発展をとげた。第二次大戦中には、アメリ
カでは、国会図書館に、戦時コミュニケーション実験研究部が設置され、とくに、敵国の出版物の研究が行なわれ、
内容分析学の確立をみた。数理文献学が、一般に、過去の文献(主として古文献)を分析することが多いのに対し、
内容分析掌は、一般に、現代の、新聞、雑誌など、ジャーナリズムの文章などの伝達内容を分析することが多い。
しかし、共通の特徴もある。それは、数量的、数理的な記述を行なうことである。現在、数理文撃や、内容分析学
には、統計学や確率論、情報理論、多変量解析論などが導入され、コンピュータの利用などは、ふつうのこととな
っている。組織的な、数量化の手続きをへることにより、主観的な判断の余地は、小さくなる。本質的なものがう
きぽりにされ、法則は、みいだされやすくなる。そして、得られた知識は、もっとも集約して記述されるようにな
る。
『魏志倭人伝』『古事記』『日本書紀』などについての、これまでの方法による研究は、ほとんど行なわれつくし
たといってもよいだろう。新しい方法なくしては、飛躍的な知識の増大は、もはや望めない段階にきている。とく
に、卑弥呼問題や、邪馬台国の位置についての問題などは、系統的、組織的な方法によらないかぎり、解決不可能
なところまできているといえる。私は、この本のなかで、『魏志倭人伝』『古事記』『日本書紀』などを通じて行
なわれた、過去の世代から現代の世代へのコミュニケーションの内容を、数理文献学、内容分析学など、情報科学
の立場から、分析整理した。夾雑物をのぞき、法則をみいだし、矛盾は尖鋭な形でとりだそうとした。そして、矛
盾を止揚して議論を発展させ、結論をみちびこうとした。このような操作を、意識的にくりかえして行なった。す
なわち、自然科学に、きわめて近い立場をとったといってもよいだろう。私は、数理文献学や内容分析学が、邪馬
台国問題を、すくなくとも文献学的に解決するための、きわめて有力な方法であると考えている。数理文献学や内
容分析学の立場からみるかぎり、「邪馬台国=九州説」は、「邪馬台国=畿内説」にくらぺ、ほとんど、決定的に
有利であるようにみえる。だれが行なったとしても、このような立場からするかぎり、この結論は動かないであろ
う。 <安本美典(やすもと・びてん)産能大学教授 文学博士。文章心理学、数理歴史学>
4.コンピュータの、文献学・歴史学への応用
周知のように、コンピュータは経済活動や技術計算に使われるだけではない。そもそもは砲弾の着弾位置を計算す
るために開発されたコンピュータだが、いまや洗濯機の水量までコントロールしている。当然大學や研究所などで
も使われているが、コンピュータと言えばまず当然理科系の学問に即用いられる。今や、天文学や原子力やバイオ
の分野では、コンピュータが無ければ研究はたちまち行きずまってしまう。DNAの塩基の組み合わせなど、コン
ピュータが無ければやろうと思う学者はいないかもしれない。世界中の幾つかのコンピューターは、いまだに円周
率を計算し続けている。しかし勿論コンピュータは理科系だけの道具ではない。前項で見たように、今日では文献
学やその他の人文系学問にも、コンピュータは有効な道具としてふんだんに使用されている。では我が国では、い
つごろから文化系の学問にコンピュータは使用されはじめたのだろうか。事務処理道具としての使用は相当古いは
ずだ。図書館や博物館での蔵書や収蔵品の管理などにも結構古くから使われてきた。しかし、文化系の学問におい
てコンピュータが本格的に使用されたのはいつ頃で、それはどんな分野なのだろうか。
以下は、社団法人 情報処理学会のWEBにみる、情報処理に関する学会の「研究報告一覧」である。
研究報告 一覧 最終更新日:Thu May 17 17:17:41 2001
-------------------------------------------------------------------------------
自然言語処理 (NL) | 1981 〜 |
− 計算言語学 (CL) | 1975 〜 1980 |
知能と複雑系 (ICS) | 1997 〜 |
− 人工知能 (AI) | 1990 〜 1996 |
− 知識工学と人工知能 (AI) | 1982 〜 1989 |
− 人工知能と対話技法 (AI) | 1977 〜 1981 |
− マン・マシン・システム (MS) | 1973 〜 1976 |
システムLSI設計技術 (SLDM) | 1999 〜 |
− 設計自動化 (DA) | 1982 〜 1998 |
− 電子装置設計技術 (DT) | 1979 〜 1981 |
− 計算機設計自動化 (DA) | 1973 〜 1976 |
データベースシステム (DBS) | 1992 〜 |
− データベース・システム (DBS) | 1982 〜 1991 |
− データベース管理システム (DBMS) | 1977 〜 1981 |
− データベース(DB) | 1973 〜 1976 |
マルチメディア通信と分散処理 (DPS) | 1985 〜 |
− 分散処理システム (MDP) | 1979 〜 1984 |
− コンピュータネットワーク (CNET) | 1975 〜 1978 |
コンピュータビジョンとイメージメディア (CVIM) | 1996 〜 |
コンピュータビジョン(CV) | 1979 〜 1995 |
− イメージプロセッシング (IP) | 1975 〜 1978 |
システムソフトウェアとオペレーティング・システム (OS) | 1993 〜 |
− オペレーティング・システム (OS) | 1984 〜 1992 |
− 計算機システムの制御と評価 (CSDA) | 1978 〜 1981 |
− 計算機システムの制御と評価 (CSDA) | 1982 〜 1983 |
− 計算機システムの解析と制御 (CSDA) | 1978 〜 1981 |
− システム性能評価 (SE) | 1974 〜 1977 |
計算機アーキテクチャ (ARC) | 1977 〜 |
− 計算機アーキテクチャ・マイクロコンピュータ (CA) | 1976 〜 1976 |
− 計算機アーキテクチャ (CA) | 1974 〜 1975 |
− マイクロコンピュータとワークステーション (MIC) | 1988 〜 1991 |
− マイクロコンピュータ (MC) | 1977 〜 1987 |
ソフトウェア工学 (SE) | 1977 〜 |
グラフィクスとCAD (CG) | 1982 〜 |
− コンピュータ・グラフィクス (CG) | 1981 〜 1981 |
ヒューマンインタフェース (HI) | 1989 〜 |
− 文書処理とヒューマンインタフェース (DPHI) | 1987 〜 1988 |
− 日本語文書処理 (JDP) | 1985 〜 1986 |
− 日本文入力方式 (JI) | 1981 〜 1984 |
ハイパフォーマンスコンピューティング (HPC) | 1993 〜 |
− 数値解析 (NA) | 1982 〜 1992 |
情報システムと社会環境 (IS) | 1998 〜 |
情報システムと社会環境 (IS) | 1998 〜 |
− 情報システム (IS) | 1984 〜 1997 |
情報学基礎 (FI) | 1986 〜 |
コンピュータと教育 (CE) | 1988 〜 |
アルゴリズム (AL) | 1988 〜 |
人文科学とコンピュータ (CH) | 1989 〜 |
音楽情報科学 (MUS) | 1993 〜 |
オーディオビジュアル複合情報処理 (AVM) | 1993 〜 |
グループウェアとネットワークサービス (GN) | 2001 〜 |
− グループウェア (GW) | 1993 〜 2000 |
音声言語情報処理 (SLP) | 1994 〜 |
プログラミング (PRO) | 1995 〜 1997 |
− プログラミング−言語・基礎・実践− (PRG) | 1991 〜 1994 |
− ソフトウェア基礎論 (SF) | 1982 〜 1990 |
− プログラミング言語 (PL) | 1985 〜 1990 |
数理モデル化と問題解決 (MPS) | 1995 〜 |
分散システム/インターネット運用技術 (DSM) | 1999 〜 |
− 分散システム運用技術 (DSM) | 1996 〜 1998 |
デジタル・ドキュメント (DD) | 1996 〜 |
モバイルコンピューティングとユビキタス通信 (MBL) | 2003 〜 |
− モバイルコンピューティングとワイヤレス通信 (MBL) | 2000 〜 2002 |
− モーバイルコンピューティング (MBL) | 1997 〜 1999 |
コンピュータセキュリティ (CSEC) | 1998 〜 |
電子化知的財産・社会基盤 (EIP) | 1998 〜 |
ゲーム情報学 (GI) | 1999 〜 |
高度交通システム (ITS) | 2000 〜 |
高品質インターネット (QAI) | 2001 〜 |
システム評価 (EVA) | 2001 〜 |
ユビキタスコンピューティングシステム (UBI) | 2003 〜 |
情報メディア (IM) | 1991 〜 2000 |
医療情報学 (MED) | 1979 〜 1982 |
− 医療情報学 (MED) | 1973 〜 1978 |
--------------------------------------------------------------------------------
All Rights Reserved, Copyright(C) Information Processing Society of Japan
Comments are welcome. Mail to address sig@ipsj.or.jp, please.
情報処理学会だから、計算機アーキテクチャやプログラミングといった言葉が並んでいるのは仕方ないが、この中
でこのHPのテーマに関係ありそうな分野は、自然言語処理 (NL)1981 〜、計算言語学 (CL)1975 〜 1980 、人文
科学とコンピュータ (CH)1989 〜、の3つぐらいである。計算言語学は1981年以降は自然言語処理と呼び方が
変わったようだが、計算言語学と書かれている時代の研究報告書の一覧を以下に列記してみる。
--------------------------------------------------------------------------------
研究報告 「計算言語学」
--------------------------------------------------------------------------------
1975 ・万葉集の検索システム 蓼沼良一、志村栄一
・カナ漢字変換の研究 送迎仮名による同音異字語の判別 保原信、谷津直和
・日本語のコンコーダンス 坂本義行、岡本哲也
・日本語構文解析システムやまと 西村恕彦
・日本語の語彙・構文の解析 雨宮真人、若山忠雄
・研究報告「計算言語学」1975年度 目次|Web会員サービスメニュー
・大量言語処理におけるエラーと対策 斉藤秀紀、岡昭夫、中野洋、米田正人
・言語理解システム開発のための道具立て LISPを中心とするファシリティ群
渕一博、田中穂積
--------------------------------------------------------------------------------
1976 ・語彙調査の一貫処理システム 中野洋
・日本語の活用処理 坂本義行
・述語を中心とした構文解析プログラム 石綿敏雄
・姓名の漢字仮名変換システム 中村祥次郎、田中康仁
・自然言語処理研究の現状 第6回国際計数言語学会に出席して 長尾真、辻井潤一
・漢字の入出力処理について 坂本義行
・自然語による図形解釈および記述システム 岡田直之
・STAIRS/USにおける検索方式と問題点 間下浩之
・「ヤチマタ」における擬似日本語
諸橋正幸、藤崎哲之助、鷹尾洋一、間下浩之、渋谷政昭
・係り受け関係に基づく文献の検索 高松忍、大塚和彦、西田富士夫
・企業名のカナ漢字変換システム 田中康仁、大久保静子
・NOBOL4処理系の移植経験 白浜律雄
--------------------------------------------------------------------------------
1977 ・同姓同名の発生頻度 田中康仁
・高校教科書語彙調査の概要
中野洋、斎賀秀夫、土屋信一、岡昭夫、野村雅昭、佐竹秀雄、斉藤秀紀、田中卓志
・構文統計について 木村睦子
・日本語品詞列集成の作成 西村恕彦、荻野綱男
・漢字姓名による検索 田中康仁
・日本語の点字情報に関する計算機処理(1) Braille 符号と漢字の変換処理 坂本義行
・特許請求範囲文の段落分割 斉藤裕美、野寄雅人、森健一、下村尚久
・日本語の自立語辞書 坂本義行
--------------------------------------------------------------------------------
1978 ・パターン・マッチイングによる分かち書き 企業名について 田中康仁、加藤栄樹
・法令改正に関する日本語の処理 佐藤雅之、岡本哲也
・日本語の文節の認定 坂本義行
・TSS漢字エディタの設計 荻野綱男
・文章解析のアルゴリズム化への試み 石綿敏雄
・COLING 78 に出席して 長尾真
・意味構造からの日本語文生成プログラムについて(T) 佐藤泰介
・漢字ドット・フォントからベクター・フォントへの変換 間下浩之
--------------------------------------------------------------------------------
1979 ・ヨーロッパ共同体における自動翻訳計画 Vauquois Bernard
・自動翻訳のためのソフトウェア・サポート Vauquois/Bernard
・CL研究会ニュース(1) _$.:ARTICLE_AUTHORS$_
・日本後の点字情報に関する計算機処理(2) 仮名点字の仮名漢字変換 坂本義行
・技術論文表題の英和自動翻訳の試み 長尾真、辻井潤一、建部周二
・CL研究会ニュース _$.:ARTICLE_AUTHORS$_」
・ヨーロッパにおける機械翻訳の現状 長尾真
・認知科学の概観 第1回認知科学会議に出席して 溝口文雄
・仮名漢字自動変換方式による日本語ワード・プロセッサ 天野真家、河田勉、森健一
・ヨーロッパの言語処理の現状 辻井潤一
・統語処理と意味解釈を同時に行うシステムについて 白井英俊、横尾英俊
・日本語の形態素解析について 首藤公昭
・大規模漢字データの検証(姓,名ファイルをもちいて) 田中康仁
・文字の計量調査 田中卓史
・文章解析のアルゴリズム化への試み(続編) 石綿敏雄
--------------------------------------------------------------------------------
1980 ・拡張LINGOLのn進木への拡張 畝見達夫、田中穂積、市川惇信
・自然言語のための階層的意味表現システム(LOGICS)とその応用について 西田豊明、堂下修司
・手続き記述文章の分析 桃内佳雄
・新編日本語品詞列集成について 田中穂積、荻野孝野、荻野綱男
・IDIOM形カナ漢字変換システムの試作
木村久正、白鳥嘉勇、小橋史彦、山階正樹、萩野輝雄
・音声応答システム等における任意複合数詞音声の合成方式の提案とその評価実験 若鳥陸夫
・英日機械翻訳における多品詞,多義ならびに意訳処理 高松忍、西田富士夫
・漢字列長単位用語の抽出 田中康仁
・日本語文の構文分析アルゴリズムとその能率 文節わかち書き入力文の場合 日高達、吉田将
・実用的な漢字符号系作成の試み 門脇信夫
・日本語文向き点字符号系作成の試み 門脇信夫
・日本語の数表現の解析 田中康仁
・漢字−カナ変換システムのその後の展開
日本語論文タイトルからのキーワード自動抽出システム(JAKASZ) 荒木啓介
・Terminology Data Bankについて 長尾真
・専門用語の自動抽出 田中康仁
・シナリオを用いて構造化されたキーワードをアブストラクトから抽出する一手法
堀浩一、斉藤忠夫、猪瀬博
・MDSによる日本語入力と編集処理について 坂本義行
・仮名漢字変換のための文法解析 大河内正明、藤崎哲之助、諸橋正幸
・分類番号つけ支援システム 中野洋
・表方式を用いた文節構造分析アルゴリズムとその能率について 吉村賢治、日高達、吉田将
・計算機マニュアルを対象とした日英機械翻訳システムにおける日本語文の解析
長尾真、辻井潤一、森正裕、久米雅子
・計算機マニュアルを対象とした日英機械翻訳システムにおける英文の生成
長尾真、辻井潤一、畑崎香一郎
・Silver Jubilee on Machine Translation 和田弘
・計算言語学研究会ニュース 第8回計算言語学国際会議(COLING80)のお知らせ ARTICLE_AUTHORS
--------------------------------------------------------------------------------
この報告書群にはこれ以降2003年度までの報告書がビッシリ並んでいる。なかには読みたいなと思うタイトル
の報告書もあるのだが、残念なことに読めるのは学会の会員のみである。有料で読めると書いてあるが、値段を見
ようと思ってもサーバーのエラーや、そのページが「 NOT FOUND」になる。もしや、うちの会社はここの会員では
なかろうかと総務に確認したが、会員ではなかった。「学会」だもんなぁ。うちの会社には縁がないか。しかし、
こういう論文を一般人がFREEで読めるようにする事こそ、学問の目的ではないだろうか。
そのために納税者は、将来の腐敗官僚を育ててると思いながらも、東大や京大の膨大な予算に大きく異議を唱えて
いないのだ。社会に還元しない学問などに、我々はいつまでも税金を費やしていいのだろうか。とは言っても、こ
こは社団法人なので、直接には納税うんぬんとは関係ないが、しかし何かスッキリしないのは事実だ。
以下が、「人文科学とコンピュータ」に収録されている報告の、若干の説明が附記されていた部分から、歴史学に
関する主なものをpick-upしてみた。勿論、本文の内容は見れない。(USER-ID、パスワードがあれば閲覧できる。)
-------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.003 - 004 最終更新日:Tue Jun 19 14:12:57 2001
--------------------------------------------------------------------------------
集落遺跡間ネットワークのモデル化 弥生時代中期の畿内社会と石材移動
加藤常員/小沢一雅/今枝国之助 岡山理科大学/大阪電気通信大学/岡山理科大学
本稿では、集落遺跡のある集まりを想定し、遺跡間のネットワークを提示するモデルを提案する。示される遺跡間
のネットワークは、社会構成や文物の移動・伝播などを示すものと考える。提案するモデルでは、遺跡間の距離と
位置関係に着目し、ネットワークを構成する。ネットワークを構成する辺(路)は、遺跡間の係わりの度合いの強
弱により決定される。具体例として、弥生時代中期の畿内の54ヶ所の拠点集落遺跡(位置データ)に本モデルを
適用して、社会構成と石器石材の移動経路(網)を求めた結果を示す。また、その結果と考古学的知見との比較・
検討を行う。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.003 - 005 最終更新日:Tue Jun 19 14:12:57 2001
--------------------------------------------------------------------------------
年輪年代測定法と年輪データベース 光谷拓実 奈良国立文化財研究所
奈良国立文化財研究所は、1980年から年輪年代測定法の試行的研究を開始した。その結果、ヒノキ(Chamaecyparis
obtusa Endl.)、スギ(Cryptomeria japonica D.Don)、コウヤマキ(Sciadopitys verticillata Sieb. et Zucc.)は、
この研究に最も適した樹種であることが明らかになった。現在ヒノキの暦年標準パターンは、紀元前206年から1988
年までの2194年間にわたって完成した。この暦年標準パターンは、広い地域において遺跡出土木材、古建築部材、
美術作品などの年代測定に有効であることが明らかになった。1980年から集積してきた年輪データは400万
データに近い。我々は1986年に年輪データベース(<Na>ra National Cultural Properties
Research Institute D___-endrochronology S___-ystem : NADS)を構築した。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」アブストラクト No.005 - 007 最終更新日:Tue Jun 19 14:15:38 2001
--------------------------------------------------------------------------------
歴史学研究支援システムの開発 星野聰 京都大学大型計算機センター
一般に市販されている日本語処理のためのソフトウェアは、現代日本語の処理のために設計されているので、古典
テキストの処理に適しているとは言えない。そこで、安価なパーソナル・コンピュータを用いて、日本歴史及びそ
の関連分野の研究支援のソフトウェア開発を行なっている。筆者は、このシステムを用いて、注釈や読みなどの付
いた古典テキストの編集・印刷・検索や歴史地理研究のための地形図の表示、過去の地形・図との比較、地形図へ
のコメントの記入などの機能を有するソフトウェアを開発し、この分野の研究に有効なことを示した。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.006 - 002 最終更新日:Tue Jun 19 14:15:38 2001
--------------------------------------------------------------------------------
歴史的資料情報特性と機能空間に関する考察 八重樫純樹 国立歴史民俗博物館
人文系機関等における歴史的資料情報化の国内的な諸研究・活動はすでに10年になろうとしており、社会的な要求、
情報機器の社会的普及等の諸状況においてこれらの広域的情報化の活動は開始されようとしている。しかし、人文
系諸分野・機関等における業務実態は必ずしも情報化に適合するよう整理されているわけでもない。これらの原因
は種々あるが、本質的に歴史的資料の多様性、断片性、また研究視点の個性化の諸問題を整理する必要がある。こ
こでは今後活発かするであろう歴史的資料の情報・データ化の諸問題について、一般論として示すものである。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.007 - 004 最終更新日:Tue Jun 19 14:15:39 2001
--------------------------------------------------------------------------------
遺跡データベースと映像化 及川昭文 国立教育研究所
データベースの利用形態として最もよく知られているのは情報検索であるが,データベースからテキスト情報のみ
を取り出すのではなく,検索結果を数量的に処理し,グラフを作成したり,2次元・3次元イメージを表示したりす
ることも行われるようになってきた。現在,遺跡データベースを利用して,それらのデータを映像化するためのシ
ステムの開発を進めており,映像化の意義,今後の課題等を含めて現在までの開発状況についての中間報告を行う。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.007 - 005 最終更新日:Tue Jun 19 14:15:39 2001
--------------------------------------------------------------------------------
古墳の復元とビジュアライゼーション 小沢一雅 大阪電気通信大学工学部
考古学的形状復元問題の一環として前方後円墳の形状復元をとり上げる。築造後約1500年を経過した前方後円墳の
現状は、一般に築造時の原形とはかなりの隔たりがあり、原形を推定するためには経験的知識の活用が不可欠であ
る。本稿では、他の考古学的なモニュメントへの応用をも意識しながら、前方後円墳の形状復元の手順とその基本
をなす考え方を述べる。とくに、統計的手法の導入によるいわゆる経験的知識の再構成とその利用について述べ、
システム化における基本方針を導く。考古学的形状復元問題に見られる現実の多様性に対応する開かれたシステム
をめざして、ESRAT と名づけた復元支援システムの構成を概説し、二三の具体的な事例について実施した復元実験
を報告する。さらに、可視化の視点から、形状復元された古墳の3次元映像化を、曲面モデリングにもとづくレイ
トレーシング技法によって実行し、得られた映像作品を紹介する。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.007 - 007 最終更新日:Tue Jun 19 14:15:40 2001
--------------------------------------------------------------------------------
遺跡の空間分布にもとづく中心遺跡の推定
加藤常員 大阪電気通信大学短期大学部 小沢一雅 大阪電気通信大学工学部
盆地や沖積平野などの一定の地域内に存在する同時期の集落遺跡の配置状況から、その地域の中心地(遺跡)を推
定する"中心遺跡推定モデル"を提案する。本モデルでは、情報の伝達の視点から、中心遺跡を情報の送信・受信に
優位な位置にある遺跡とみなした。具体的な奈良盆地の137ヶ所の弥生集落遺跡の位置データを用いて中心遺跡
の推定実験を行った結果、"唐古・鍵遺跡"が中心遺跡となった。この結果は、考古学的知見に合致したものである。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.007 - 008 最終更新日:Tue Jun 19 14:15:40 2001
-----------------------------------------------------------------------------
貝塚データベースの作成と利用 松井章 奈良国立文化財研究所
現在、考古学ではさまざまなデータベースが作成されつつあり、その一部はすでに利用されている。しかし、大部
分はパーソナルコンピュータのもとで構築され、大型機のもとでの考古学とその関連分野の共有データベースとし
ては、まだその端緒についたばかりである。
今回報告する「貝塚データベース」は、かって酒詰仲男が『貝塚地名表』『日本縄文石器時代食料総説』において
集成し、及川昭文らがデータベース化した「 SAKAZUMEファイル」(及川ら19)を発展させ、1960年以降のおびただ
しい発掘調査報告書、雑誌論文にあたり、追加、修正したものである。また、今回の集成にあたっては貝塚だけで
なく、洞穴やそれ以外の遺跡で動物遺存体の報告されているものも加え、遺跡出土動物遺存体データベースとした。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.007 - 010 最終更新日:Tue Jun 19 14:15:40 2001
--------------------------------------------------------------------------------
コンピュータの考古学への応用例 現場からの報告
高井健司 (財)大阪市文化財協会 辻純一 京都市埋蔵文化財研究所 中川正人 滋賀県埋蔵文化財センター
ここ数年考古学研究へのパソコンの浸透は著しく、ワープロとしての利用までを含めると半数以上の研究者がパソ
コンを利用しているといっても言い過ぎではないだろう。大学や研究所では大型コンピュータを利用した研究も行
われるようになってきている。現在の考古学分野でのコンピュータ利用の形態を大きく分けると、()データベー
スの構築と利用、()画像処理、()統計的分析等になるが、その利用範囲は今後ますます広がっていくものと予
想される。とくに増大する発掘調査の省力化、効率化を図るためにコンピュータを利用することは、既に多くの機
関で試みられており、その利用形態もそれぞれ特色のあるものとなっている。ここではそのような実例を、3つの
機関から問題点、今後の課題等を含めて報告する。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.009 - 002 最終更新日:Tue Jun 19 14:18:46 2001
--------------------------------------------------------------------------------
考古学データのソリッドモデル レイリー ポール アイ・ビー・エム英国サイエンティフィック・センター
コンピューターグラフィックスが考古学においてどのように使われているかの現状についてまず概観し,層やたて
穴,遺物の分布などの考古学的包含層をソリッドモデルのレンダリングによってモデル化する研究について述べる。
ソリッドモデルは可視化以外にも,モデル内に潜在するジオメトリーや構造を見つけながら,さまざまな次元のデ
ータ群の中に何が新しい知見を獲得することを可能にするもののようである。このような研究は,考古学が一般に
考えられているものと密接な関係を持つ。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.010 - 005 最終更新日:Tue Jun 19 14:18:47 2001
--------------------------------------------------------------------------------
三次元モデル構築システムの考古学への応用 : 遺跡におけるフレーク集中遺構の復元
深沢百合子 ケンブリッジ大学 考古学部
埋蔵文化財である考古学の遺跡から出土する遺構を三次元モデル構築システムを活用し、復元した試みを述べる。
これはただ単に記録保存するという目的の為ではなく、研究データとして将来において十分活用できる状態で保存
できることを可能とする。そしてこのような復元方法は、考古学の分野においての人間の諸活動の復元に迫れる遺
物、遺構の分析方法に新しい視点を導きだし、それに基ずく発掘からのデータは新しい発掘方法を導きだすことを
示唆する。さらに研究データの提示方法においても明瞭かつ容易な操作で記録保存が可能となり、フロッピータイ
プの発掘報告書をつくることを提案する。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.022 - 006 最終更新日:Tue Jun 19 14:30:04 2001
--------------------------------------------------------------------------------
ナイフ形石器の多属性分析 長野県茶臼山遺跡出土石器を例として 高見俊樹 諏訪市教育委員会
日本の後期旧石器時代に見られる最も一般的な定形的石器は「ナイフ形石器」と呼ばれている(ヨーロッパ旧石器
時代の backed bladeに類する石器)。ナイフ形石器は大まかな形と二次加工の方法に対して与えられた名称であ
り、特定用途に使用された道具としての石器総体に一致するものではない。一般にナイフ形石器には、同遺跡同時
期に属する石器群の中でも多様な形と多様な二次加工が見られ、その多様性が大きな特徴となっている。本稿では、
ナイフ形石器の多様性の実態を明らかにするため、長野県茶臼山遺跡出土の石器群を対象として、ナイフ形石器の
細分を試み得られた類型相互の関係について考察した。分析にあたっては、複数属性を同時に比較するために、統
計学的手法(林式数量化理論第III類=correspondence analysis・主成分分析・クラスター分析)を用いた。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.039 - 001 最終更新日:Tue Jun 19 14:50:47 2001
--------------------------------------------------------------------------------
木簡研究支援システムにおける視点操作と分類機構 森下淳也 ※1 大月一弘 ※1 杉山武司 ※2 上島紳一 ※3
※1 神戸大学国際文化学部 ※2 姫路獨協大学情報科学センター ※3 関西大学総合情報学部
階層構造グラフを用いた木簡研究支援システムにおける視点操作と分類機構について考察した.木簡などのデータ
ベースはデータが収集された時点で,データに対して大まかな構造しか与えられていない.言わば半構造化の状態
のまま,構築されている.このような半構造化データに対して,複数の観点から,自在に属性付けを行うため,属
性集合をグラフのノードと枝にリンクさせて,視点を表すノードからのサブグラフについて,グラフの上位から下
位へと属性集合を伝播させるビューを定義した.このグラフを研究者が使用する際には,自分の視点に基づいた透
過的なデータ操作が行なえることが重要である.これを支援するスコープの概念とカテゴリによって実現される
分類機構を論じた。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.040 - 011 最終更新日:Tue Jun 19 14:50:51 2001
--------------------------------------------------------------------------------
有限要素法を用いた古墳石室強度のシミュレーション 塚本敏夫 木村健治 財団法人元興寺文化財研究所
古墳の内部施設は大陸の新しい墓制の影響から5世紀から6世紀にかけて竪穴式石室から横穴式石室へと大きく変化
して行く。それは単葬用から追葬用へという内部施設の機能差と構造差だけでなく、墳丘を構築した後、墓壙を掘
り内部施設を構築するものから墳丘と同時に内部施設を構築するものへという、古墳という土木構築物の構築方法
の違いを含む古墳祭祀の変化であると指摘されている。そして、この背景には高度な土木技術を持った大陸系工人
集団の関与が想定されている。しかし、石室の研究は型式学的研究や土層層位からの構築過程の推定等に留まって
おり、構造物としての視点からの研究はほとんどなされていないのが実状である。本研究では石室を土中埋納構造
物と考え、竪穴式石室を閉鎖型中空構造物モデル、横穴式石室を開放型中空構造物モデルと考え、発掘調査のデー
タから3次元 CADを用いてコンピュータ上でモデリングを行う。次に、建築・土木や機械設計に用いられている有
限要素法応力解析の手法を用いて構造解析を行い、石室構築技術および古墳構築技術の変遷過程を定量的に解明す
ることを目的とする。その結果、古代の土木技術史の解明、古墳祭式の変遷過程の解明や今後の古墳保存技術の研
究の発展の一助となると思われる。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.042 - 004 最終更新日:Tue Jun 19 14:53:51 2001
--------------------------------------------------------------------------------
前方後円墳復元形の生成システム
西風隆 治居秀法 小澤一雅 大阪電気通信大学大学院工学研究科情報工学
前方後円墳は、約1500年以前(4世紀〜6世紀)に造られた墳墓であって、われわれの遠い先祖によって築造された
巨大モニュメントである。現在、約5000基の前方後円墳が確認されているが、残念なことにそのほとんどが長い年
月の間に、様々な要因(雨風・地震や都市開発など)による崩壊をこうむり、当時の姿で保存されているものは皆
無である。本研究では、それらの前方後円墳の形状復元問題をとりあげ、建造当時の復元形の推定と復元図生成シ
ステムの構築を行なった。復元図の生成には、前方後円墳の7つの部位のデータ(墳丘長および、後円部・くびれ
部・前方部それぞれの幅と高さ)を必要とするが、データの一部が未知の場合、既知データにもとづいて推定する。
本論文では、その推定法と前方後円墳復元図の生成結果を紹介する。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.044 - 003 最終更新日:Tue Jun 19 14:53:54 2001
----------------------------------------------------------------------------
「江戸時代における人口分析システム(DANJURO ver.2.0)」の構築
川口洋 上原邦彦 日置慎治 帝塚山大学経営情報学部
江戸時代の日本では,「宗門改帳(しゅうもんあらためちょう)」と総称される和紙に筆墨を用いて記録された古
文書史料が,原則として集落ごとに毎年作成されていた。「宗門改帳」の保存状態がよい集落では,民衆生活の具
体像を示す人口学的指標を長期間にわたって求めることができる。本システム構築の目的は,史料読解から人口学
的指標算出に至る作業時間の短縮,研究過程の再現性の確保,古文書史料の保存,研究者間での史料と分析方法の
共有の4点である。本システムは,「宗門改帳」古文書画像データベースと人口分析プログラムから構成されてい
る。現在,福島県会津地方の4ヶ村,延べ約5万人分の個人情報がデータベースに登録されており、60項目にのぼ
る人口学的指標をグラフ表示することができる。インターネットを通じて本システムに接続することにより,情報
検索,指標表示が極めて容易に実行できるだけでなく,文字データと古文書画像データを対照することにより,シ
ステム構築者の史料整理過程を利用者が再現,検討できる。
--------------------------------------------------------------------------------
All Rights Reserved, Copyright(C) Information Processing Society of Japan Comments are welcome.
Mail to address sig@ipsj.or.jp, please.
ざっと眺めて、あぁこれを読んでみたいなぁと思った歴史ファンは多いのではないかと思う。おもしろそうなタイ
トルが並んでいる。
これを見ると、歴史学の分野にも相当コンピュータ処理の波は押し寄せているのがわかる。勿論文献学においても、
当然情報処理化研究の層は厚い。見てきたような語彙を抽出しての統計だとか、人麻呂歌集の復元だとかがみえる。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.008 - 004 最終更新日:Tue Jun 19 14:15:41 2001
--------------------------------------------------------------------------------
日本古典文学本文データベース形成とデータ記述文法 安永尚志 国文学研究資料館
日本古典文学作品の校訂本文データベースを作成している。データベース化は、岩波書店発行の旧版日本古典文学
大系(全100巻、約600作品、約3千万字)を対象としている。本稿では、本文データベースの設計概念を述べ、そ
の実現方法についてまとめる。この様な古典の時代、ジャンルに渡る網羅性かつ信頼度の要求されるデータベース
では、国文学コーパスの概念が必要で、そのデータモデルを示した。また、本文データベースの作成状況をまとめ、
サービス計画を示し、合わせて諸問題にふれた。とくに、本文データベースの実現に当たり、標準化が不可欠であ
り、データ記述文法を提案している。この文法の概要を示し、実際の適用について述べる。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.011 - 002 最終更新日:Tue Jun 19 14:18:48 2001
------------------------------------------------------------------------------
聖書とコンピューター 伊藤利行 岡崎学園国際短期大学設置準備室
聖書への視点とコンピューター利用の形態、人文科学にコンピューターを利用する場合の様々な問題点と発表者自
身のコンピューター利用について述べる。聖書は広汎な内容を含んでいるので歴史、言語、宗教・思想など様々な
視点から研究される。歴史や言語の分野ではコンピューターの利用によって具体的な研究の進展が見られるが、宗
教・思想の分野ではそうではない。人文科学にコンピューターを導入する場合、コンピューターのユーザー・イン
ターフェイスがあまり良くない事とコンピューターを使用しようとする人が問題分析を行うことが困難である事か
ら研究上の困難が生じている。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.022 - 003 最終更新日:Tue Jun 19 14:30:03 2001
--------------------------------------------------------------------------------
コンピュータを利用した国文学の授業の一形態 人麻呂歌集の復元 吉村誠 山口大学教育学部
国文学研究におけるコンピュータ利用の形態を授業化した場合の実践報告が本稿である。本授業は、国文学の内容
に中心を置きながらも、コンピュータ教育を兼ねた研究支援を紹介するという意義も含めている。筆者の担当する
授業は万葉集を対象としたものであるので、万葉集に含まれる人麻呂歌集所出歌約400余りを対象にしてコンピ
ュータによるデータ処理をほどこし、原本の体裁がどのようであったかを推定するという授業内容である。しかし
授業化にあたっては、国文学という内容との整合性、学習者の基礎知識、興味などが複雑に関わっている。実践の
結果、整合性や興味という点では学習者の評価を得たが、特にプログラミング学習を中心としたコンピュータ教育
という点が、難解であるという結果であった。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.023 - 001 最終更新日:Tue Jun 19 14:30:04 2001
--------------------------------------------------------------------------------
パーソナルコンピュータによる中期インド・アリアン聖典の計算機解析 逢坂雄美 仙台電波工業高等専門学校
我々は、マッキントッシュを使って、中期インド・アリアン言(プラークリット語)で書かれた聖典の計算機解析
の為の以下のツールを開発した。()ローマ字化テキスト作成に適したフォント体系の構築;()デーヴァナーガ
リー文字で書かれたテキストをローマ字に書換:既に5冊の最重要なテキストの書き換えを終了した;()聖典の
韻律解析プログラムの作成;()単語の索引・逆引き索引と詩脚の索引・逆引き索引作成プログラムの開発;()
文法解析プログラム作成。現在、この言語は、大量のテキストデータを検討・比較しなければならない研究状況に
ある。上記の計算機ツールは、この分野の研究を飛躍的に進展させるものと思われる。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.026 - 009 最終更新日:Tue Jun 19 14:34:26 2001
--------------------------------------------------------------------------------
パソコンを利用した日本文学作品の研究 芥川龍之介作品のテキストデータベース化を通して
上村和美 社会保険神戸看護専門学校
私は博士論文『テキストデータベースによる色彩表現の研究−芥川龍之介作品への適用−』の研究にあたり、パソ
コンを利用し、テキストデータを作成、用例を抽出するという作業を行った。ここで「テキストデータベース」と
読んでいるものは、分かち書きされていたり、品詞情報が付加されているものではなく、いわゆるプレーンテキス
トのことである。パソコンを利用する以前には、用例の抽出作業は手作業で行っていた。しかし、手作業には限界
があり、大量のデータの中から正確に用例を抽出するというのは困難であった。したがって、本来は研究の手段で
あった用例の抽出が研究の目的そのものにならざるを得ない状況であった。そこで、本研究では大量のデータから
正確に用例を抽出することを実践するために、パソコンを利用した。テキストデータの作成にあたっては、さまざ
まな問題が生じた。まず第一に入力の問題、さらには英語のように分かち書きがなされていない日本語を処理する
上での問題等である。本発表では、日本文学作品の中でも特に、近代文学作品研究におけるパソコンの利用および
問題点を、実践した経験から述べてみたい。
--------------------------------------------------------------------------------
研究究報告 「人文科学とコンピュータ」 アブストラクト No.026 - 010 最終更新日:Tue Jun 19 14:34:26 2001
--------------------------------------------------------------------------------
単語情報に基づく源氏物語の計量分析
村上征勝 ※1 , 上田英代 ※2 , 樺島忠夫 ※3 , 今西祐一郎 ※4 , 上田裕一 ※5
※1 統計数理研究所 ※2 古典総合研究所 ※3 神戸学院大学 ※4 九州大学 ※5 もとぶ野毛病院
筆者達は、池田亀鑑編著『源氏物語大成』(中央公論社)をテキストとして「源氏物語」の品詞情報付きデータベ
ースを構築中であり、このデータベースを用いて紫式部の文体を調べ、「源氏物語」の複数著者説、書写者による
補筆の可能性等の問題の解明を試みている。この小論では、単語の出現頻度の情報に基づくいくつかの分析結果に
ついて報告する。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.045 - 010 最終更新日:Tue Jun 19 14:53:57 2001
-----------------------------------------------------------------------------
平安時代の文学作品における形容動詞対照語彙データベースの構築とそれを用いた語彙論的研究
村田菜穂子 岩田俊彦 大阪国際女子短期大学
日本語の語彙研究及び語彙史研究分野の中で、遅れている形容動詞の研究を進展させるために、まず第一段階とし
て「平安時代の文学作品のおける日本語形容動詞対照語彙表データベース」の作成を進め、それを基礎資料として、
語彙量の点から、平安時代を代表する、語構成の異なる二つの形容動詞(「ゲナリ型形容動詞」と「カナリ型形容
動詞」)について比較・対照を行った。その結果、二つの形容動詞の語彙量と作品の成立年代とは密接な関わりを
もち、さらには、両者の作品への受け継がれ方には差違があるという実態が明らかになった。
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.051 - 001 最終更新日:Wed Oct 24 16:24:36 2001
--------------------------------------------------------------------------------
梵文『法華経』の系統分類 逢坂雄美 山崎守一 仙台電波工業高等専門学校
大乗仏教研究において最も重要な文献の一つである法華経の梵文写本は,発見された地域により,ネパール・チベ
ット,カシミール,西域の3種に分類できる.これら3種の写本間には類似性と共に著しい相違も見られると同時
に,同一地域で発見された写本間ですら相違が見られるのが実情である.特にネパール系写本間の相違が著しい.
このように錯綜した写本の系統解明は系統ごとの校訂本作成にとって必須である.系統解明のために,31の写本の
各詩偈の類似性,つまり語順対応・文字対応情報を抽出して,主成分分析及びクラスター分析を適用した.これら
の系統は,@ネパール系の10の紙写本群,A9本のネパール系の貝葉写本と2つの紙写本を含む11写本群,B数本
の写本からなるいくつかの小群に整理できた.この小群にはカシミール本と西域本が属している.この結果は,言
語学的研究から特徴を抽出したデータに対して,同様な手法を適用して得られた結論と殆ど同じであった.
--------------------------------------------------------------------------------
研究報告 「人文科学とコンピュータ」 アブストラクト No.053 - 007 最終更新日:Fri Mar 29 17:47:25 2002
--------------------------------------------------------------------------------
古典和歌における反復表現の諸相 福田智子 ※1 , 南里一郎 ※1 , 竹田正幸 ※2
※1 純真女子短期大学 ※2 九州大学大学院システム情報科学研究院
要旨.古典和歌データから同一文字列を2回以上含む歌を抽出し,その分析を行う.『万葉集』と,『古今集』か
ら『新続古今集』までの勅撰集との,あわせて22の歌集に載る約40,000首から,5字以上の同一文字列が
2回含まれる歌を48首抽出した.そして,それらの用例の,歌集ごとの分布状況や,表現効果の特質を考察した.
その結果,『万葉集』に見られる7字の同一文字列反復が『古今集』には皆無であること,『新古今集』以降の勅
撰集には5字以上の同一文字列反復の例はまずなく,唯一例外なのが『玉葉集』であることなどが,具体的に明ら
かになった.
--------------------------------------------------------------------------------
All Rights Reserved, Copyright(C) Information Processing Society of Japan Comments are welcome.
Mail to address sig@ipsj.or.jp, please.
と、ここまで見てきて頂いて、さぁそれでは肝心のテーマである「コンピュータによる古事記・日本書紀の分析」
を検討する事にしよう。
5.コンピュータによる記紀分析
ところが、ところがである、「コンピュータによる記紀分析」をメインに掲げた研究書・論文の類が見あたらない
のである。何だと!ここまでひっぱてきて何じゃそれは、と怒鳴られそうだが、本格的に記紀を情報処理の方式で
研究・分析した書物はない。おそらく私が探し出していないのだろうが、どこかに手がかりがありそうな気もする
のだが、どなたかこれを見て是非教えて頂きたい。わずかに日本国語学会の研究発表論文をまとめた年鑑のなかに、
1800篇余の古事記に関する論文と、400篇弱の日本書紀研究論文があり、そのなかに、以下の2篇(1篇?)
があった。
〇日本神話に見られる名称のコンピュ−タ−による分析 (上) ヴィエスワフ・コタンスキ 松井嘉和・訳
亜細亜大学 アジア研究所紀要16 2・2
〇日本神話に見られる名称のコンピューターによる分析 (下) ヴィエスワフ・コタンスキ 松井嘉和・訳
亜細亜大学 アジア研究所紀要17 2・2
日本古典のコンピュータ化についてはさまざまな問題がある。一つは字体の入力である。現在ではもう存在しない
字を外字として製作していくことの労力は相当なものである。また特に古事記は俗に言う万葉仮名式の形態をもっ
ている。これを処理するプログラムがどんなものになるのかちょっと想像がつかない。しかし、それにしても、と
いう気がする。2000を越す記紀の論文があって、コンピュータ処理に言及したものはわずか1篇のみだ。それ
も日本人の著者ではない。なんかなぁ、という気がしてしようがない。ほんとにどなたかご存じの方があったら是
非教えてほしい。
ただ、暦という観点から、日本書紀をコンピュータで分析して、儀鳳暦・元嘉暦・グレゴリオ歴の対照表を製作し
た内田正男(うちだまさお)氏の以下の著書がある。「日本書紀暦日原典」(内田正男編:雄山閣出版)。内田氏
は1921年小田原の生まれで、1944年東京天文台に入り1967年東京大学講師となり、引き続き東京天文
台に勤続し1982年定年退官。著書に『暦と日本人』、『暦の語る日本の歴史』、『こよみと天文今昔』、『暦
と時の事典』などがあり、その他共同執筆も多数ある。内田氏のこの本「日本書紀暦日原典」を読めば、例えば日
本書紀の「欽明天皇」の23年(任那滅亡)が西暦562年にあたる事などがただちにわかる。氏は、儀鳳暦・元
嘉暦の暦法を用いて、神武東征から書紀の終りまでの全暦日をコンピュータで算出しているが、このような方法が
なかった時代には、神武天皇元年1月1日が、紀元前660年の2月11日に当ることをつきとめるだけでも、か
なりな計算を必要としたはずである。しかし、これは日本書紀という書物そのものの研究ではない。あくまでも暦
日のためのコンピュータ利用である。
また、天皇の在位期間を求めるのに、前出安本美典氏がコンピュータを用いているのは広く知れ渡っており、一連
の多数の著書がある。これを安本氏は「統計的年代論」と呼んでいるが、今では、この方法(統計学)を用いたや
り方には反論もある。(坂田隆:「コンピュータではわからない邪馬台国」等)。しかし、コンピュータを歴史の
謎解きに用いたのは、私が知る限り、我が国ではおそらく安本氏が最初である。私が勤める事になっていた(歴史
倶楽部HP、「青春の城下町」を参照されたし。)、今はもうない福岡県の夕刊紙に安本氏の記事が載ったのは、
私が高校生の終り頃か大学に入った頃である。もう40年近く前になると思う。「コンピュータを用いて邪馬台国
を発見」と大きく記事が出ていたのを覚えている。その頃は歴史にさほどの興味もなく、「ヘェ−、ほんまかいな」
という程度の興味しかなかったのだが、今となっては、コンピュータを用いた、文献の数理的分析方法の採用とい
う先見性に賛辞を送らざるを得ない。偉大な功績だと思う。現在のように計算機を用いた手法がポピュラーになっ
てからは、氏の採った方法やデータに多少の疑問点はあるかもしれないが、それをあげつらう前に、氏の功績をま
ず称えるべきではないかという気がする。
安本説の論旨を、このHPで詳細に説明するには力量不足なので、一連の著作をお読みいただきたいが、大まかに
概要をまとめれば以下の
ような事になろうか。
(1).天皇の在位期間を計算すると、邪馬台国の卑弥呼は、ちょうど神話に言う「天照大神」の時代と重なり合
う。
●神武から昭和天皇に至る歴代天皇の平均在位期間を計算する。古代ほど短く、近代ほど在位期間が長い。
●中国、西欧の王達の在位期間も求め、古代から現代に至る支配者層の在位期間も、同様の傾向にある。
●「記紀神話」を「天の岩戸」以前と以後に分けて考えると、古事記・日本書紀ともに、天照大神が一人で行動す
る回数は、天の岩戸事件の前が圧倒的(古事記16回、書記18回)で、以後の古事記 6回、書記 1回を圧倒してい
る。また、天照大神とペアで行動する「高御産巣日神」(たかみむすびのかみ)が、最高主権者的に行動する回
数は、天の岩戸事件の前は皆無で、以後は古事記9回、書記12回となり、これは「卑弥呼=天照大神」と考え
ると、天の岩戸事件は「卑弥呼の死」と考えられる。
●PC用の天文ソフト「ステラナビゲーター」を使って古代の天文情報を得ると、卑弥呼の死んだ年の前後に北九
州で日食が起きている。これが天照大神の「天の岩戸」事件と考えられる。
今まで、このような手法で天皇の在位期間を推測した研究者などは居なかったのではないだろうか。
世界中の首長者の在位期間と比較するなどという着眼点はすばらしいと思う。勿論、その国に書き残された文献か
らの生没年なのであくまでも仮定ではあるが、それにしても世界中で同じ様な傾向にあるのは非常に興味深い。な
んらかの法則があり、同様な在位期間を持つということなのか。いずれにしても、こういう方法だと「ではなかろ
うか。」式の、主観的な観測に基づく論説は意味をなさないのは確かだ。
(2).「古事記」「日本書紀」に出現する地名を統計化すると、神々の活躍の地は筑紫(北九州)になる。
●「古事記]神話に現れる地名の内、西海道(九州地方:筑前、筑後、豊前、豊後、肥前、肥後、日向、大隅、薩摩、
壱岐、対馬)が36個で全体の29.5%を占め、次いで山陰道(山陰地方:出雲、因幡、丹波、丹後、伯耆、隠岐、
但馬、石見)が34個で27.9%を占める。古事記神話は「筑紫・出雲」で全体の半分を占め、これは神々がこの地方
で活躍していた事を物語っている。
(3).北九州、それも甘木・朝倉を中心とする地方の地名を、その位置・方位をそっくりそのまま大和(奈良)
地方へ持っていくと、驚くほどその対比が合致する。
●ちなみに同じ地名を列記すると、三輪を開始地点として時計回りに、三輪、三井、池田、平群、住吉、三笠山、
春日、笠置、田原、山田(上山田)、鳥屋(見)山、玖珠(国巣)、天ヶ瀬、高取山、香山(香久山)、三瀬
(水間)、久留米(久米)、朝倉、加美(賀美)、長谷山、高田、雲堤、小田、三輪、となる。(宮崎公立大学
の奥野正雄教授は、さらに検証を深め、この2地方の名前の一致箇所を100カ所以上指摘する。)
安本説の一番の目玉はこの地名かも知れない。これは相当説得力がありそうな気がする。一般的に地名の残存度が
氏名等に比べればはるかに高いという事は理解できるが、ここまで一致していると、「うぅ〜ん、そうかもしれな
い。」と言う気になる。しかもそれが自分の故郷の地名という事になると、これはもう熱中せざるを得ないのはご
理解いただけるのではないかと思う。上の図で、真ん中あたりにある「長谷山」という区域が私の生まれ故郷であ
る。子どもの頃、山の麓に「長谷山観音」というのがあって(今もあるが)、これは奈良の長谷山から来ていると
いう話を聞いた。それ故ここを「長谷山」という事になったと古老から聞いていたが、安本説に従えば反対なのだ。
今度奈良の「長谷寺」にいったら、近所の人の顔をよく見てみよう。私に似た顔があるかもしれない。
(4).邪馬台国時代の遺跡、及び遺跡から出土する遺物の出土状況は、圧倒的に北九州が占めており、大和地方
は卑弥以後、すなわち古墳時代になって、遺跡・遺物が集中するのである。
このHPのあちこちで書いているが、私も「記紀神話」の舞台は九州で、しかも主として弥生時代の事を書き残し
ていると思う。一度安本氏に倣(なら)って、神代の記述に現れる遺物の出現回数を「記紀」から数えた事があっ
た。回数は忘れたが、一番多く出現するのは確か「剣」だったと思う。次が「鏡」「玉」という順番だったのでは
なかろうか。正確には記憶していないが、これらは明らかに「弥生時代・古墳時代」の事であり、この3つは多く
が九州、それも北九州の弥生墳墓から出土するのだ。弥生時代の近畿圏は銅鐸文化だった事を考えると、我が国古
代の文献に全く記載がないのは、これらの勢力が大和朝廷につながる神々の系譜ではなかった事を示している。
そしてこれらの弥生時代の遺物(剣・鏡・玉)は、今でも我が皇室の「3種の神器」である。そして、やがてこの
3つの遺物は、近畿地方の古墳からも多く出土するようになる。皇室の祖先は、北九州から奈良へ行ってやがて全
国に古墳時代を定着させたという見方は、考古学的知見とも文献上からも一番合理的な考え方のような気がするが
どうだろう。
(5).上記を総合すると、北九州にあった「邪馬台国」が、記紀に言う「神武東遷」を行ってその殆どの勢力が
大和地方へ移動したと考える、いわゆる「邪馬台国東遷説」が一番合理的・論理的である。
●従って、「邪馬台国=高天原=甘木・朝倉地方」となり、「卑弥呼=天照大神」となるのである。
概略的には、上記が安本美典氏の主張である。著作では、(自作・他作の)いろんなデータを示し、これらを細か
く説明している。氏の著作は膨大で、立派な装丁の本からペーパーブックスまで何十冊とあるが、その主旨は殆ど
上記に挙げた論点の繰り返しである。あらゆるデータを引っ張り出してきて、上記の骨格を細部に渡り肉付けして
いく作業を今も続けている。コンピュータは、氏の今後の研究にも、大いに力を発揮するに違いない。
「5.コンピュータによる記紀分析」で紹介した以下の論文について、何とかして読めないものかと思い亜細亜大
学のアジア研究所宛にメイルを出してみた。すると驚いたことにアドレスを尋ねられ、2,3日するとB5版の分
厚いペーパーバックの「紀要」が送られてきた。感謝感激である。亜細亜大学アジア研究所に感謝したい。
〇日本神話に見られる名称のコンピュ−タ−による分析 (上) ヴィエスワフ・コタンスキ 松井嘉和・訳
亜細亜大学 アジア研究所紀要16 2・2 (1989)
〇日本神話に見られる名称のコンピューターによる分析 (下) ヴィエスワフ・コタンスキ 松井嘉和・訳
亜細亜大学 アジア研究所紀要17 2・2 (1990)
この論文は、一言で言えばコンピュータを応用しての、古事記に現れる神名解釈の方法について述べた物で、著者
の独特な神名解釈のコンピユータ使用方法を述べた物である。著者のコタンスキ博士は、ポーランドのワルシャワ
大学名誉教授で、長年にわたり同大学で日本研究の中心的な役割をはたしてきた人物である。博士が古事記研究に
着手したのは1970年代の中頃で、もともとは古事記のポーランド語への翻訳作業に始まっているらしい。この
論文は1986年にパリで刊行された「Computer Analysis of Japanese Mythological Names」を翻訳したもので
ある。ここに概略を紹介したいと思ったのだが、1度サッと呼んだくらいではなかなか咀嚼できないので、いっそ
のこと全文を掲載しようかとも思ったが、論文を全編入力するわけにもいかず悩んでいるところである。
大學や著者の了解も得なければならないので、可能だとしてもしばらく時間がかかると思う。お急ぎで、どうして
も読みたい方は、亜細亜大学のHPからアジア研究所へアクセスしてメイルを出せば多分同じように送ってくれる
のではないかと思う。但し、在庫にも限りがあるだろうから、保証の限りではない。(2004年9月)
邪馬台国大研究・ホームページ /記紀の研究/コンピュータによる記紀分析