近年欧米の計量社会言語学では、言語習得について数多くの研究がなされつつあり、幼児期においてすでに大人の変異が習得されている事実を見出し、また逆に一生近くかかって習得される変異の存在を明らかにして... more 近年欧米の計量社会言語学では、言語習得について数多くの研究がなされつつあり、幼児期においてすでに大人の変異が習得されている事実を見出し、また逆に一生近くかかって習得される変異の存在を明らかにしている。しかしながら、例え10代であっても、20代以上の話者の文法とは根本的な差があるとする考えもある。ここでは 10代の文法に的を絞り、東京語格助詞「を」の変異データに基づいて10代の変異状況を調べることで、20代以上の「大人」と10代の文法の差異を探る。方法としては、「を」の変異の中心的要因であった、「目的語名詞句と動詞の隣接性」、「目的語名詞句の形式差」、「スタイル差」の3要因について10代話者内のゆれ、そして大人話者との差異を検討する方法を採用した。結論として、大人話者で強力な要因であるものは10代話者でも同様な働きをしているが、スタイルのような社会性の高いものになると両者間で乖離が見られるということが明らかになった。Recent developments in quantitative sociolinguistics have revealed a number of interesting facts about language acquisition. Thus, while children are found to be participating in on-going language change from quite early age, there exists certain variation that is not quite mastered even after adulthood. As to the grammar of teenagers, there are cons and pros for including their data for sociolinguistic research due to its seemingly immature status. This paper examines the (variable) grammar of teenagers by focusing on the zero-marking of the accusativecase in Tokyo Japanese. Q...
近年Bailey & Preston (1996)に見られるように、変異理論的枠組みによる 中間言語変異の分析が盛んになって来つつある。第2言語習得という観点 を取り入れることにより、制約条件の... more 近年Bailey & Preston (1996)に見られるように、変異理論的枠組みによる 中間言語変異の分析が盛んになって来つつある。第2言語習得という観点 を取り入れることにより、制約条件のありようについて第1言語習得、第 1言語変異や言語普遍性・個別言語の特殊性と組み合わせた仮説設定が可 能になる。本稿ではKYコーパスを用いて韓国語母語話者の日本語発話に見 られる「を」格ゼロマーク化現象の分析を行い、松田 (1995, 2000) に報 告されている第1言語変異との比較を試みた。「を」格ゼロマーク化には、 言語普遍的要因(目的語名詞句形式差)とともに、日本語(東京語)個別 的な要因(目的語名詞句と動詞の隣接性、スタイル差)も絡むが、KYコー パスの韓国語母語話者データの分析からは、このうち目的語名詞句形式差 のみが統計的に有意な要因として検出された。さらに日本語習熟度別の分 布からは、習熟度の上昇に従って、この要因のレベルの分布が母語話者の それに接近するという傾向が認められた。とりわけ普通名詞>f 代名詞とい う差は、すでに中級レベルから習得されている事実は、第1言語変異と第 2言語習得における言語普遍的要因の役割という点から大いに注目に値す る。Recent surge in variationist analysis of interlanguage variation (Bailey & Preston(1996)) blazed a way for a detailed analysis of variable constraints in L2 acquisition. An interesting possibility here is a correlation between the language varieties (L1 / L2 acquisition, L1 variation) and the distinction between language-universal constraints and language-particular constraints. This paper analyzes a zero-marking of (o) (Matsuda 1995, 2000) in Japanese s...
橋下大阪府知事の就任以来2年間にわたる定例記者会見記録を用いて、そこで言及される人名、政党名、そして自称詞について分析を行った。人名については一時期頻繁に言及されるものと、長期にわたりほぼ安定し... more 橋下大阪府知事の就任以来2年間にわたる定例記者会見記録を用いて、そこで言及される人名、政党名、そして自称詞について分析を行った。人名については一時期頻繁に言及されるものと、長期にわたりほぼ安定して言及されるものがあり、それらが言及時期によりいくつかのパターンをなしていることがわかった。政党名では、就任当初は自民・公明・民主の3党でほとんど差がなかったものが、2009年8月の政権交代以降民主党の言及数が自民・公明を圧倒している。さらに政党名に「さん」付けをする割合を検討すると、やはり民主党に対する「さん」付けが大幅に増加していることがわかった。自称詞を分析すると、もともと高かった「僕」の割合が2年目にはさらに増えて、「私」がほとんど使われない状態になっていることが判明した。最後に今後有望そうなトピックを3点指摘した。The press conference transcripts of Toru Hashimoto, Governor of Osaka Prefecture, were analyzed with respect to the person names, name of the political parties and first person pronouns that are used in his speech. The person names were found to be categorized into two groups, those that are mentioned only for a short period and those that are more or less constantly mentioned through his two years\u27 tenure. The Governor also shows an interesting change in the frequencies with he refers to the LDP (Jiminto), the Komeito and the DPJ (Minshuto), While there was scarcely any difference as to the number of times that the Governor...
デジタル機器の一般化に伴い,社会言語学的フィールド調査で収集された数多くの音声資料をデジタル化することが可能になりつつある.この小論では,筆者の経験に基づいてデジタル化の過程を解説する.とりわけ... more デジタル機器の一般化に伴い,社会言語学的フィールド調査で収集された数多くの音声資料をデジタル化することが可能になりつつある.この小論では,筆者の経験に基づいてデジタル化の過程を解説する.とりわけ,なぜデジタル化が必要か,どういった原則に基づいて作業を進めるべきか,各種フォーマットやメディアの差異,そして考えられる落とし穴などに触れる.結論として提言するのは,(1) 今後フィールドワークでの録音はDATが用いられるべきであり,現有のアナログ資料もまずDATに移してからデジタル化を進めるべきであること,(2)長期保存用にはCD-Rが適していること,そして(3)文字化・コード化作業にはMDが最適であること,を述べた.With digital recording devices becoming more and more popular, sociolinguists are now able to digitize the analog interview recordings they have collected over the years. Drawing on my experience, this lab note explains the digitization process step-by-step: Why digitization is needed, what the guiding principles should be, what the differences among various digital formats/media (DAT, CD-R and MiniDisk) are and what the pitfalls are (e.g. SCMS). In particular, I suggest that (1) future field recordings should be made with DAT recorders, and that existing analog tapes should first be transferred to DAT tapes so that start IDs can be entered; (2) long-term preservation should be d...
One of the interesting possibilities suggested by the development of interlanguage studies is a c... more One of the interesting possibilities suggested by the development of interlanguage studies is a correlation between the L1/L2 variation and the distinction between language-universal/language-particular constraints governing the variation within a language system. If there were a language-universal constraint such that all the (known) languages conform to it, then one would expect that interlanguage, as a language system in itself, should conform to such a constraint as well. This paper takes up the zero-marking of an accusative case marker o in Japanese to explore the possibility mentioned above. Zero-marking of o, which is most sensitive to the adjacency between the object NP and the verb (a language-particular constraint), has at least one constraint that is known to be a language-universal : the distinction between the lexical NP and the pronoun for the object NP, with the pronoun significantly disfavoring zero-marking. This is easily explainable as a reflection of a language un...
熊谷・篠崎(2006) を改変したモデルを使って国立国語研究所による第2 次岡崎敬語調査の各場面に対する回答を機能面から分割し、各場面内・異なる場面間で浮かび上がる規則性を探索的に調査した。熊谷... more 熊谷・篠崎(2006) を改変したモデルを使って国立国語研究所による第2 次岡崎敬語調査の各場面に対する回答を機能面から分割し、各場面内・異なる場面間で浮かび上がる規則性を探索的に調査した。熊谷・篠崎(2006) は6 つの「コミュニケーション機能」、およびそれぞれの機能に場面に応じた下位分類を設けたモデルを提案した。これを改変したモデルを立て、機能的単位の組み合わせを「談話型」と呼ぶこととした。各場面データ396 件すべてについて、前述の枠組みにしたがって談話型の集計を行った結果、(1) おつり確認場面における「再確認要求」、(2) おつり確認場面における「きりだし」と「状況説明」の弱い相補性、(3)「きりだし」の通場面的傾向、の3 パターンが浮かび上がった。This is an interim report of an exploratory analysis of the response patterns to three questions from the Okazaki Honorific Survey II (conducted by the National Language Research Institute in 1972 (国立国語研究所, 1983). Using the modified version of discourse pattern by Kumagai and Shinozaki (2006), we found that (1) when asked to complain to the shopkeeper about the incorrect sum of change, subjects rarely make an explicit request to that effect, (2) there exists weak complimentarity between an initial move and explanation of the situation in the same in the change-complaint question, and (3) there is an implicational tendency whereby those using the initial ...
本論文では、現在進行中の中間言語プロジェクト第2次報告として、中国 語母語話者による日本語発話に見られる「を」格ゼロマーク化の変異分析 の結果を報告する。松田 (2001)で行った韓国語母語話者... more 本論文では、現在進行中の中間言語プロジェクト第2次報告として、中国 語母語話者による日本語発話に見られる「を」格ゼロマーク化の変異分析 の結果を報告する。松田 (2001)で行った韓国語母語話者の分析手法をそ のまま採用し、KYコーパスの中国語母語話者の部分から学生の発話のみを 採取し分析した結果、名詞句と動詞の隣接性、名詞句形式差、名詞句の人 間性、そして被験者日本語習熟度レベルのうち、習熟度レベルがW型の分 布を示して、唯一ゼロマーク化率と有意な相関を示し、名詞句形式差は有 意な傾向を示すに止まった。しかしながら習熟度レベル別に名詞句形式差 を検討すると、それぞれのレベルにおいて似通った分布が見られ、特にゼ ロマーク化率に関する語彙名詞 > 代名詞という序列には変化がなかっ た。この事実は松田 (2001)で提示した名詞句形式差制約の普遍性のサポー トと考えることができる。また、習熟度レベルのW型分布には、適応・学 習過程一般でも似たような仮定が見られることから、独立的な説明が可能 であると思われる。In this second report on the interlanguage variation project I analyze the zero-marking of o in the natural speech of Chinese L2 speakers of Japanese. Following the same methodology as that of Matsuda (2001) for Korean L2 speakers of Japanese, I showed that among the several factors examined (NP-V adjacency, the form of the object NP, the humanness of the object NP and the proficiency level of the speaker measured as OPI level) the proficiency level of the speaker is the only significant factor. However, each level maintains the ...
現在進行中の変化であるサ変動詞の五段化・上一段化について、現行法令を対象にサ変動詞8語を取り上げ、その内的要因として後続要素による変異形の分布を分析した。田野村(2001) が精査した後続環境に... more 現在進行中の変化であるサ変動詞の五段化・上一段化について、現行法令を対象にサ変動詞8語を取り上げ、その内的要因として後続要素による変異形の分布を分析した。田野村(2001) が精査した後続環境に従って調査した結果、変異が確認されたのはごく一握りであり、用例が発見された環境でもサ変~五段・上一のいずれが出現するのかが固定している場合が多数であった。ここから考えて、後続要素別はサ変動詞変異でもっとも強力な内的要因である可能性が高い。動詞相互の比較からは、サ変~五段活用変異の大きな制約条件である特殊拍に関する一般化が法令コーパスでも成立することが確認された。つまり音韻的な要因も関わっていることになる。以上の事実は、法令コーパスでも先行研究で使用された他の資料と同様な形で変異が複数の内的条件によって制約されていることを強く指し示すものと解釈できる。Using the data from the Online National Law Database System, we analyzed the variation and ongoing change of sahen (the irregular conjugation pattern of suru) verbs between the godan (regular “pentagrade” )-type and kami-ichidan (regular“upper-unigrade”)-type conjugation, with respect to their internal factors. It is demonstrated that in only a few of the contexts proposed in Tanomura (2001) was there meaningful variation. In many of the cases, only one of the variants was found, forming a categorical environment. This suggests that the environment following the verb is one of the strongest internal factors. Anothe...
VARBRULプログラムは欧米の変異理論研究では一般的なフリーウェアだが、日本においてはVARBRUL登場後30年たってなお、その紹介が十分に成されているとは言い難い状況にある。本稿ではVARB... more VARBRULプログラムは欧米の変異理論研究では一般的なフリーウェアだが、日本においてはVARBRUL登場後30年たってなお、その紹介が十分に成されているとは言い難い状況にある。本稿ではVARBRULの基本から、実際の使用法、そして現バージョンのVARBRULが持つ諸問題点を指摘するものである。VARBRUL is a logistic regression program that has been used in variationist sociolinguistics since the 1970s. Although it is by now the default analysis tool in the field, the software is far from popular in Japanese sociolinguistics, partly due to the poverty of introductory texts for this sophisticated freeware. This paper is intended to be a general introduction to the software, covering the statistical problems it is intended to deal with, as well as the practical how-to\u27s of the program
On the Conservatism of Embedded Clausesl Kenjiro Matsuda Embedded clauses have been claimed to sh... more On the Conservatism of Embedded Clausesl Kenjiro Matsuda Embedded clauses have been claimed to show syntactic conservatism against incoming linguistic change (GivOn 1979, Hock 1986, Matsuda 1993). While all of the cases show the conservative nature of dependent clauses whether it is a past change or a change in progress, it is not clear what causes such a tendency. Three possible explanations-syntactic (Emonds 1970, Ross 1973), speech stylistic, discourse-pragmatic (Givan 1979, Hooper and Thompson 1973), and processing-based (Townsend, Ottaviano and Bever 1979, Kluender and Kutas 1993)-are proposed and closely examined. It is then suggested that the most reasonable scenario is that the conservatism is caused by both discourse-pragmatic and processing-based factors.
Changes of sa-hen verbs into go-dan and kamiichi-dan verbs in the Japanese law from the year 2001... more Changes of sa-hen verbs into go-dan and kamiichi-dan verbs in the Japanese law from the year 2001 to 2011
The on-line full-text database of the Minutes of the Diet offers linguists a unique resource for ... more The on-line full-text database of the Minutes of the Diet offers linguists a unique resource for corpora study of the modern Japanese language; with all the debates and information of the session searchable by keywords, and the name of the speaker, date, House, etc., all laid out in an easy-to-use interface. The database is accessible from ordinary internet browsers, and the search results are easily downloadable to the user\u27s PC. This article explores this resource\u27s possibilities for various linguistic research (lexicon, syntax, dialectology and discourse analysis), demonstrates actual searches and their results, and carefully examines the limitations that necessarily arise from several sources (e.g. editorial practices of the Diet Office transcribers)
Does language variation exist within the law? This paper takes up the question, and examined the ... more Does language variation exist within the law? This paper takes up the question, and examined the existing Japanese law with a corpus tool. The language variation. two alternations between two different verb conjugation types (sahen/godan (e.g., zokus-inai/zokus-anai 'do not belong') and sahen/kami-ichidan (e.g., ronz-uru/ronz-iru 'to discuss') conjugation pattern) are shown to exist in the law through an examination of 14 high-frequency verbs. Not only does the variation exist among different laws, it also exists between laws promulgated in the same year and, furthermore, within the very same law. As such, the result most eloquently demonstrates that the variation is well below the consciousness of the lawmakers and bureaucrats, and that language variation can be located even in the most carefully scripted texts. Some advantages and disadvantages of law texts as linguistic data are discussed, and the following topics are mentioned for further study: the need for tracing the revision history, a possibility of fossilization of an archaic form through a copy-and-paste of the specific phrases in the preceding laws, and the identification of unnoticed dialectal forms in bylaws.
神戸松蔭女子学院大学Kobe Shoin Women\u27s University大正~昭和戦前期のSP盤演説レコードを収めた岡田コレクションでは,「場合」の読みとして「ばやい」という発音が多... more 神戸松蔭女子学院大学Kobe Shoin Women\u27s University大正~昭和戦前期のSP盤演説レコードを収めた岡田コレクションでは,「場合」の読みとして「ばやい」という発音が多数を占めている。これに対して辞書記述,コーパス,国会審議の会議録・映像音声などを調査すると,現代語における読みでは「ばあい」が圧倒的多数を占めており,「場合」の発音が岡田コレクションの時代から現代にかけて大きく変化したことが窺われる。「ばやい」は寛政期の複数方言を記した洒落本に登場する形式であり,明治中期に発表された『音韻調査報告書』は「ばやい」という発音が全国的に分布する方言形であったことを示す。本論文では岡田コレクションにおける「ばやい」という発音が,講演者達の母語方言形であり,その後標準語教育が浸透するなかで「ばやい」が方言形,さらに卑語的表現として認知され,最終的に「場合」の読みとして「ばあい」が一般化したことを主張する。A survey of the recordings in the Okada Collection, a collection of speeches from the Taisho era to the early Showa era (from the 1910s to 1940s), shows that the most popular pronunciation of the word baai (場合) was bayai, and not baai. This is in stark contrast to contemporary Japanese, where, if we follow the distribution of dictionary entries, statistics based on the corpora, and actual pronunciations employed in Diet meetings, the word is pronounced as baai by an overwhelming majority. This paper attempts to account for the difference through examining corpus data, histor...
神戸松蔭女子学院大学Kobe Shoin Women’s University旧字体と新字体の混在するテキストは,形態素解析において誤解析の原因となることが多く,その対策としては形態素解析辞書の... more 神戸松蔭女子学院大学Kobe Shoin Women’s University旧字体と新字体の混在するテキストは,形態素解析において誤解析の原因となることが多く,その対策としては形態素解析辞書の記載に異体字を加える方法,そして予め漢字を新字体に置換しておく方法,また複数の辞書を使い分けるといった方法が考えられる。本稿では字体置換6通りと,辞書の使い分け3通りを掛け合わせた18組の組み合わせで國/国,會/会,關/関3対の旧/新字体の対を含んだテキストの形態素解析を行うことで,目的とする漢字を含む形態素がどれほど正確に切り出せるのかを検討した。データとして第1~10回までの国会会議録を用いた。結果は,漢字置換で隣接する漢字が旧字体の場合に旧字体に置換し,隣接しない場合は新字体とするという置換法(デフォルトを新字体とする日和見置換)と,すべてについて近代文語UniDicを用いるか,1949年の当用漢字字体表告示を境として,それ以前では近代文語UniDicを用い,それ以後では現代語書き言葉UniDicを用いる方法が,もっとも正確に当該漢字を含む短単位形態素を切り出せるというものであった。形態素解析辞書の記載に異体字を加える方法には,異体字が記載されていない形態素が出現した場合に対応ができないという欠点があるのに対して,漢字置換と辞書の使い分けを活用する方法は,そうした場合にも柔軟に対応が可能であるという利点があることを主張した。Japanese texts containing a mixture of old-(kyūjitai) and new-(shinjitai) style kanji scripts pose a serious problem for an automatic morphological analyzer. However, recent developments in various dictionaries by era, undertaken by the corpora project at NINJAL, have brought about a new opportunity to solve this problem. Another promising solution is to replace the script i...
