明治書院 『日本語学』 1992年 8月号

連載 「私のパソコン言語学」 12

『四国言語地図』を作る

高 橋 顕 志

1992年5月10日執筆



はじめに

  高知女子大学文学部国語学研究室では、1986 年以来、パソコンを利用して四国全域をフィールドとする方言の言語地理学的調査をおこなっている。高知市内の高等教育機関に在籍するこの地域からの出身学生に対して、ことばと民俗に関するアンケート調査をおこない、その結果を、すべてパソコンを利用して処理しているのである(注1)

1 調査表作成

(以下、図1を参照しながら)



  この一連の作業は、高知女子大学文学部国文学科の授業の一環としておこなっている。毎年の受講生一人一人に、自分が使い他人に理解してもらえなかったいいまわし、また、自分のおこなう行動様式で、人とはすこし違っているのではないかと思われる行動様式を、なにか一つつかまえさせる。四国各地からの、また西日本各地からの出身者の多い本学の学生は、このようなものを容易に見つけ出すことができる。そういう経験からつかまえた言語差・様式差の一端を、授業で受講生各自に発表させる。

  これに対し、他の受講生は、
 「そんな言い方なら私の所にもある」
 「私の知っている〜出身の人もそんな言い方をしている」
 「そんな行動は私のおばあちゃんがする」
などという、自分の経験を報告し合うとともに、紙に書いてさきの発表者に渡し合う。発表者各人は、他の受講生からのメモと自分の内省、また『日本言語地図』をはじめとする各種文献にあたり、自分のつかまえた項目を中心にして、意味的・語形的に、また行動様式として関連のありそうな項目へと広げていき項目を確定していく。この時点で、選択肢を5までにするべく(注2)質問文を細分化する場合がある。

  調査文と選択肢は、すべて学生の手でワードプロセッサに入力され、出力された原稿も、学生の手によって印刷され製本される。

2 調 査

  受講生は、一冊の調査表に自分自身で回答するとともに、友人に配布して回答を求める。高橋は、非常勤講師として勤めている他の大学の学生に配布し、また、卒業生などにも郵送して回答を求める(注3)

3 地点番号システム

  以後、すべてのデータは、常に地点番号と対になって扱われる。その基本となる地点番号システムについて述べておく。

  基本的な考え方は、『日本言語地図』での地点番号システムにならった。つまり、建設省国土地理院「5万分の1地形図」を基礎地図とし、それをさらに細分割し、その一つ一つの枠に、左上から右下方向へ向かって番号をふっていく方法である。『四国言語地図』の場合、「5万分の1地形図」を縦に 12 枚、横に 13 枚貼り合わせた広さを持つ地域である。各地図を、縦5等分横 10 等分して一枚の地図を 50 の枠に切り取り、それを1地点と考える(注4)

  この調査では、話者に「出身中学校名」を記入してもらうことによって、その中学校の地点番号を各自の地点番号として利用している。そのために、あらかじめこの地域に存在するすべての公立中学校の位置が確かめられ、それぞれの学校ごとに地点番号が拾い出されている。

  都市部で一つの枠の中に中学校が2校以上ある場合、また同じ中学校の出身話者がいた場合、地点番号が重複してしまうので、その場合、一方の話者には隣(上・下・左・右いずれか)の枠の地点番号を与えたり、それでも溢れてしまう場合には、地図外にまとめて表示できるように、独自の地点番号を与えたりもする。図2で土佐湾に表示されている記号群は、このように処理された高知市・南国市・安芸市・室戸市内の話者の回答結果である。私立中学・国立中学出身者の場合は、本来当人が行くべきであった地元の公立中学校名を記入してもらうことにし、その公立中学校の地点番号を当人の地点番号としている。

  話者の中には、この地図に示される地域外の中学校出身者(範囲外話者)もいる。本システムでは、その方たちの地点番号は、出身県によって
      宮崎県 「61XXX」  大分県 「62XXX」
などとすることにしており、その方たちの調査データも地図上から省くことはせず、分布図の第1行と最終行とに、出身県名とともに、分布図の中と同じ記号システムで表示することとしている。



4 データ入力  『登録』・『修正』

  回収された調査表に書かれてある話者の出身中学校名をもとに、さきの地点番号が割り振られ『登録』プログラム(注5)によって調査表に記入されている内容を、その地点番号をファイル名とした「話者毎データファイル」に登録する。

  その内容は、「原調査表」の内容と照合するために『一覧』によって「話者毎データ一覧表」として出力される。

  「原調査表」と「話者毎データ一覧表」とのデータ照合をおこない、データ入力にミスのあった部分については『修正』によって修正していく。

5 データ書換  『書換』

  さきの作業で、話者数分の「話者毎データファイル」が作成されるが、このままでは地図作成の際に不便なので『書換』によって、項目番号をファイル名とした「項目毎データファイル」に書き換える。ここで作成されるそのファイルの内部構造は、図3のとおり。



  調査表を作成するためにワープロで作成した文書ファイルを、プログラムから読み取り可能な状態にコンバートしておいた「調査文ファイル」の、必要な部分を読み込み、調査文と選択肢とを書き込む。その後に、地点番号・回答のコード番号とを地点数分書き込むのである。ファイルの冒頭に、調査年度と項目番号とを書き込むことによって、継続しておこなっているすべてのデータがこのようなファイル形式で統一され、データベース化される。

6 データ一覧  『一覧』

  『一覧』では各必要ファイルを読み込み、各種データ一覧表を作成する。各種一覧表は、直接プリンタに出力したり、ワープロの文書ファイルとして出力しておき、そのファイルをあらためてワープロから読み出し、ワープロ上で編集することも可能である。それらは、さきに述べたデータ点検のために使用されたり、報告書に掲載する「話者一覧表」などとして利用される。

7 地図化 プリンタ  『下書』・『清書』

  もともとこのシステムは、プリンタに符号の文字列として出力することを考えて作り出したシステムである。一つの地点番号の与えられている枠が「縦長」なのも、プリンタの文字の縦横比に近くしようとしたのであった。地図をディスプレィに描き、それをハードコピーする方法も考えたが、初期のハードコピーは、1枚印刷するのに数分かかっていたし、横 640 ドット縦 400 ドットのディスプレイ画面では「四国」という大きな地域は扱えないと判断したのであった。

  ここには2本のプログラムがあるが、いずれも、「項目毎データファイル」と、「海岸線」・「県境」の通っている枠をあらかじめ拾い出した「白地図データファイル」とを読み込み、プリンタに言語地図を印刷するプログラムである。

  『下書』  生データのまま地図化する。地図には、各地点にコード番号そのものが印刷される。学生にはこの段階のものを渡し、さまざまな色づけを試みさせ、最終的な符号を決定させる(注6)

  『清書』  一つ一つの項目について、それぞれの選択肢にどの符号をあてるかを入力し、また、地図の「標題」も入力し、図2にみられるような最終的な地図を作成する。なお、図1には記入していないが、このときの「標題」の部分は「目次ファイル」として蓄積され、報告書に掲載する「目次」のためのワープロ文書ファイルも同時に作成されるようになっている。

8 地図化 ディスプレイ  『画面1』・『画面2』・『画面3』

  数年前、日本方言研究会の研究発表会が、私の勤務する大学で開催されたとき、何かエキジビション的なものはないかと考え開発したプログラムである。さきに、ドット数に限りのあるディスプレイ画面では、「四国」という大きな地域は扱えないと述べたが、カラーが使えるとなると話は別である。ここでは、カラーディスプレィ上に分布図を作成する。カラーの持つ表現力は、それまでプリンタから排出される白黒のものを見慣れた目には驚異的でさえあった。ただここでは、画面上の制約から「範囲外話者」の回答が表示できない。また、選択肢の長さも制限される。

  ここには3本のプログラムがあるが、いずれも「項目毎データファイル」と「白地図データファイル」とを読み込み、ディスプレィに地図を表示するプログラムである。

  『画面1』  調査項目のX番目の項目からY番目の項目までを、一定の時間間隔Zをおきながら流す。デモ用。

  『画面2』  X番目の項目1枚を表示する。

  『画面3』  任意の2枚の地図(X番目・Y番目)をディスプレィ上の2ページに描き、一定の時間間隔Zをおきながら、交互に表示させることによって2枚を比較をする。

  この中で、研究上とくに有効となるのは『画面3』である。調査表の中では、同一の語形を、微妙に違った文脈で聞いているものが多い。そのようなものを2項目選び、交互に表示させることによって、微妙な地域差を読み取ることが可能である。2項目が地域的に相補分布していること、また、その際の若干の重なり、若干のずれを確認するのにも使用できる。印刷された2枚の地図をバインダーからはずし、重ねて窓ガラスにあてて見るという原始的な方法から開放された。

  データベースとして蓄積されている全データを読み取り対象とした『画面3』(注7)では、老年層と若年層の比較(注8)がおこなえるし、もし 10 年後同じ聞き方で調査をおこなえば、10 年間における変化を、ディスプレィ上でこまかく追跡することもできる。ただ、ハード面での制約から、一度に2項目の比較が限度である。

9 動 機

  コンピュータを利用してこのようなことをおこないはじめたきっかけは、1に「速報性」を求めたこと、2に「モグラのしっぽ的解釈」(注9)をおこないたかったことに尽きる。

  この学問は、関係者との信頼関係の上に成立していると考える。大量の調査済みのデータが、机の上で眠っているのは話者に対する背信行為であり、共同研究者たる学生に対する背信行為であると強く感じてきた。成果を早く公表し、話者の皆様にみていただく機会を多くすること、また、学生が在学中にまとめ、成果を持たせて卒業させていくのが礼儀であると考えたのである。のちに述べる「激変の時代」に突入したことも、「速報性」を求めた大きな要因であった。

  後者に関して、得られた語形をさまざまに分類してみ、そのつどそれにしたがって、白地図にスタンプを押していく気の遠くなるような作業は、言語地図を描いたことのある人間なら誰でも経験していることであろう。語形の分類を考え、それに与える符号を決めて、即座に地図化したい。それをおこなうには、コンピュータしかないと考えたのである。

問 題 点

  意気込みは上のようであった。「速報性」に関しては目標をクリアできていると考えるが、「モグラのしっぽ的解釈」までには至っていない。それは、アンケートという調査方法を採用していることによる。

  方言研究後進地域である「四国」という地域を選定したこと、また、その後、「激変の時代」に本格的に突入したことが、アンケートという方法を選択させるきっかけとなった。つまり、ボロボロと歯がぬけるように俚言がなくなっていくようすをわき目で見ながら、いつ終わるとも知れない詳密な隣地面接調査をおこなうのではなく、この地域、この時代だからこそ、まず、ラフなスケッチを大量に残したいと考えたのである。急激になくなっていく俚言の記録を、まずは残したいという欲求が優り、この方法を実施しているのだと考えている。

  「臨地面接調査」による調査結果の、語形の分類・符号与えの基本的なシステムは、さきに『松山市・高知市間における方言の地域差・年齢差』(注 10)を作成したプログラムの中にすでにできている。したがって、今回のものとリンクさせれば、「臨地面接調査」の結果を「モグラのしっぽ」的に分析した『四国言語地図』も作成可能ではある。

二人三脚

  本誌5月号掲載の、柴田・井口両先生による『糸魚川言語地図』に関する記事を読んで、もちろん調査の質・資料の質などは遠く彼の足元にも及ばないが、パソコンで言語地図を描く点のほかに、彼我にはもう一つ共通点があることに気づいた。システム開発にあたっての、親・子の「二人三脚」である。そこで彼にならって我も「子」から一言。

  高知大学附属中学校3年生の高橋真人です。『四国言語地図処理システム』について書きます。
  このシステムの基本的コンセプトは父が考えたものです。プログラムもすべて父が作りました。ただ、父の作るプログラムは冗長で、僕なら3行で済ませてしまうその同じ処理が、父のプログラムでは 10 行以上になっていたりします。当然の事ですが、そのように書かれているプログラムでは、実行速度が遅くなってしまいますので、僕が手をいれ、無駄な部分を削ったり、父の知らない高度な命令に書き換えたりします。ただ父は、プログラムの流れが自分で読めなくなると不機嫌になり「元に戻せ」などとゴネますので、実行速度をある程度犠牲にしながら、父のわかる範囲でスピード化をはかるわけです(実際はもっと高速化できるのに!)。
  パソコンの基本的な使い方は、もちろん父から教わったのですが、その後、雑誌などに載っているゲームとかのプログラムを読み、入力し、遊んでいるうちに、この分野では、いつのまにか父を追い越せたと思います。最近、父は、自分でマニュアルを読まず、わからないことがあると、すぐ僕を頼りにするようになってきました。「マコトクーン」という猫なで声がするたびに、僕は父のそばに行って、プログラムを点検し、書き換えます。「技術指導料」「助言料」と称して、いくらかせしめることもありますが、ときに、僕の小遣いでは手のでないようなソフト(「ミュージ郎」・「まいとーく」など)を買ってくれたりする(ただ半分以上父の趣味だったりする)ので、ふだんはタダです。僕自身は、受験勉強のあいまに、C言語でゲームを作ったり、それだけではヤバイので「元素記号記憶支援プログラム」を作ったりして、パソコンをいじることを合法化しています。
  学問のことはまだよくわかりませんが、僕の手伝ったこのシステムが、学問の上でお役に立つのならこんなにうれしいことはありません。
                               (たかはし まこと 記)

おわりに

  現在までに、精粗含めて 5242 項目の調査がなされ、10,354,011 バイトのデータがデータベース化されている。調査は今年度の授業でも続けられており、受講生が自分のアイデンティティ確認のためにつかまえた「気になっていた」項目と、それを広げていった調査表で調査がなされている。今年度末には、446 枚の新たな言語地図が作成されるはずである。

  今後このシステムで、四国に関するさまざまなデータを地図化しようと考えている。とりあえずは、市町村の役場所在地の地点番号をもとにして『民力』データ(注 11)を地図化することを考えている。

  さらに、四国の全中学校と私の研究室とをパソコン通信で結び、さまざまな分野の情報を収集し、即座に地図化していくという、夢のようなことを考えている。

  「あなたの校区では、黄色のタンポポと白のタンポポは、どのくらいの比率で生えていますか」
  「あなたの校区に○月○日に降った雨のPHをお知らせください」
  「あなたの学校では、卒業式に『君が代』をみんなで歌いましたか」
  「あなたの学校では、今、〜のような遊びが流行していますか」
  「あなたの学校で、○月○日インフルエンザで休んだ人は何パーセントですか」

  ことばに関することだけでなく、このような項目についても全中学校に問い合わせ、回答を入力してもらい、即座に地図化し、その地図をオンラインで全中学校にお返しし、「理科」「社会」などの教育現場で活用してもらえればと考えているのである(注 12)

  方言関係では、武智正人氏の残された『愛媛の方言』(注 13)の大量データを早急に地図化したいと考えている。

  最後に、成果の公表形態について述べておく。

  一連の成果のうち、860 項目分については印刷物の形で公表しているが(注 14)、今後「項目毎データファイル」と、それをプリンタやディスプレィ上で地図化する「プログラムファイル」、そして、まえがき・目次・本文などを格納した「テキストファイル」の三種類のファイルからなるフロッピィディスクを作成し、公表することを考えている。その形態を決断する日も、そう遠くはないと考えている(注 15)

【注】

注1 1986 年の調査は、この地域に存在する「中学校」の先生方にお願いし、「中学生」と、その方と「同居している祖父」に対するアンケート調査であった。本文で述べているスタイルによる授業での調査は、1989 年から開始し、現在4年目の調査が実施されている。 (本文の該当箇所へ戻る)

注2 のちに述べるグラフィック画面での制約によるが、また、アンケートという調査方法からもこれが限度ではないかと考えている。 (本文の該当箇所へ戻る)

注3 おおよそ 30 歳までの本学卒業生で、当該年度に出身者がおらず、地図上の空白が生まれそうな出身地の方々。 (本文の該当箇所へ戻る)

注4 『日本言語地図』の6桁地点番号システムの場合、縦・横とも 10 等分であるから、『四国言語地図』の場合は、『日本言語地図』での6桁地点番号での区画を縦に2つ並べた、縦長の区画となる。 (本文の該当箇所へ戻る)

注5 以下、開発したプログラムを『 』によって示す。ここで作成したプログラムは、すべて N-88 BASIC(86)(MS-DOS版)で書いた。高橋個人は、実行速度を上げるために、コンパイルしたものを使用している。 (本文の該当箇所へ戻る)

注6 「地図は主観だ」とこの時点で指導する。 (本文の該当箇所へ戻る)

注7 データベース化されたものはハードディスクに収録してあり、それを読み込むためには、ファイルディスクリプタ(おもにディレクトリの記述)の部分を書き換えた別のプログラムが必要である。 (本文の該当箇所へ戻る)

注8 1986 年の全中学校アンケート調査の結果 (本文の該当箇所へ戻る)

注9 W・A・グロータース 1965 年 「モグラのしっぽ −言語地理学の一効用」『日本語 5-3』 (本文の該当箇所へ戻る)

注10 1986 年9月 私家版 (本文の該当箇所へ戻る)

注11 1991 年6月等 朝日新聞社。別にフロッピィ版あり。 (本文の該当箇所へ戻る)

注12 「地方の時代」は、このような地域内ネットワークの構築によってのみ、真に到来するであろう。 (本文の該当箇所へ戻る)

注13 1957 年 12 月 愛媛大学地域社会綜合研究所 (本文の該当箇所へ戻る)

注14 『四国言語地図 −1986−』(1991・9・30)・『四国言語地図 −1990−』(1991・3・31)・『四国言語地図 −1991−』(1992・3・31)。いずれも私家版 (本文の該当箇所へ戻る)

注15 試作版は完成しているが、COMMAND.COM N88BASIC.LIB など、著作権とのからみで配布できない部分がある。この件がクリアできれば、高価な「私家版」から開放され、フロッピィディスクの実費を頂くだけで配布が可能となる。 (本文の該当箇所へ戻る)





『四国言語地図』へ