What is the best way of splitting Japanese text using Java? For Example, for the below text:
こんにちは。私の名前はオバマです。私はアメリカに行く。
I need the following output:
こんにちは
私の名前はオバマです
私はアメリカに行く
Is it possible using Kuromoji?
What is the best way of splitting Japanese text using Java? For Example, for the below text:
こんにちは。私の名前はオバマです。私はアメリカに行く。
I need the following output:
こんにちは
私の名前はオバマです
私はアメリカに行く
Is it possible using Kuromoji?
You can use java.text.BreakIterator.
The output of this program is:
You cannot use Kuromoji to look for Japanese sentence boundaries. It can split a sentence into words.