読者です 読者をやめる 読者になる 読者になる

Skyland Ventures tech ブログ

渋谷のVenture Capital Skyland Venturesのいま一番イケてる投資先、nanameue,IncとKaumoの共同技術ブログ

国語のアルゴリズム

こんにちは、ちょっと刺激的な一日だったTOMITAです。

今週は国語のアルゴリズムでしたね。

文系のイメージがありまずが、実際どうなのでしょうか?

日本語には規則性というものがあります。

例えば動詞は「U」の音で終わります。

じゃあ簡単にこの文字を抜くアルゴリズムを考えましょう。

うくすつぬ…という文字を配列に入れてマッチングするのも一つですね。

配列とは

配列というのは文字の集団です。

イメージは   [う,く,す,つ,ぬ]

といったもので、かっこの点が文字の区切りで

これは先頭から順番に番号が振られています。

マッチングとは

今回は配列を使ったマッチングなのですが、

文字通り、配列内の文字と対象になる文字が一緒か否か

ということを試す手順のことです。

やってみよう

最後の文字を抜く

今回は「あそぶ」で試しましょう。

あそぶという文字は3文字です。

実は「あそぶ」を配列に見立てた関数がありまして、

「あ、そ、ぶ」にしてくださいよー

って機能があるんです。

そして、最後の文字を抜きます。

関数は数学の世界だと「ある数を入れたら一定の数が返ってくる」ってルールがありますよね。

あれはプログラミングの世界も同じです。

今行ったのは

あそぶを配列のようにする

最後の文字を抜く

この2つです。

マッチングしよう

「ぶ」が抜けました。

次は「うくすつぬふむゆるゆぐずづぶぷ」にマッチングするかどうかです。

これをばしばしやっていくわけです。

ぷ→う   ☓ く→う   ☓ ….

こんな感じでマッチしたらOK

しなかったらNG

と伝えます。

以上!!

言いたいこと

これって動詞に限らず、

他の品詞にも特徴があります。

さらにスラングとかもあるのでなかなか難しいんですよね…

今回もObj-c書いてないですよね…すいません。