在前幾節(jié)我們學習了怎祥使用String類的split()方法分解字符串,這一節(jié)我們將學習怎樣使用StringTokenizer對象分解字符串,與split()方法不同的是,StringTokenizer對象不使用正則表達式作為分隔標記。
首先我們需要知道一個概念——語言符號,所謂的語言符號,就是指我們分析字符串時,將字符串分解成可以被獨立使用的單詞,而這些單詞就被稱作語言符號。
例如,對于字符串"You are welcome",如果把空格作為該字符串的分隔標記,那么該字符串有三個單詞,也就是有三個語言符號。而對于字符串"You,are,welcome",如果把逗號作為該字符串的分隔標記,那么該字符串也有三個語言符號。
當我們分析一個字符串并將字符串分解成可被獨立使用的單詞時,可以使用java.util包中的StringTokenizer類,該類有兩個常用的構造方法:
(1) StringTokenizer(String s)
為字符串s構造一個分析器,使用默認的分隔標記,即空格符(若干個空格被看做一個空格)、換行符、回車符、Tab符、進紙符做分隔標記。
(2) StringTokenizer(String s,String delim)
為字符串s構造一個分析器,參數(shù)delim中的字符被作為分隔標記。
注意:分隔標記的任意組合仍然是分隔標記。
例如:
StringTokenizer fenxi = new StringTokenizer("you are welcome"); StringTokenizer fenxi = new StringTokenizer("you,are; welcome",", ;");
稱一個StringTokenizer對象為一個字符串分析器,一個分析器可以使用nextToken()方法逐個獲取字符串中的語言符號,每當調用nextToken()時,都將在字符串中獲得下一個語言符號,每當獲取到一個語言符號,字符串分析器中負責計數(shù)的變量的值就自動減1,該計數(shù)變量的初始值等于字符串中的單詞數(shù)目。
通常用while循環(huán)來逐個獲取語言符號,為了控制循環(huán),可以使用StringTokenizer類中的hasMoreTokens()方法,只要字符串中還有語言符號,即計數(shù)變量的值大于0,該方法就返回true,否則返回false。另外還可以隨時讓分析器調用countTokens()方法得到分析器中計數(shù)變量的值。
例如:
import java.util.*; public class Main { public static void main(String args[]) { String s = "welcome to dotcpp(thank you),nice to meet you"; StringTokenizer fenxi = new StringTokenizer(s,"() ,"); int number = fenxi.countTokens(); while(fenxi.hasMoreTokens()) { String str = fenxi.nextToken(); System.out.print(str+" "); } System.out.println("共有單詞:"+number+"個"); } }
運行結果如下:
welcome to dotcpp thank you nice to meet you 共有單詞:9個
C語言網(wǎng)提供由在職研發(fā)工程師或ACM藍橋杯競賽優(yōu)秀選手錄制的視頻教程,并配有習題和答疑,點擊了解:
一點編程也不會寫的:零基礎C語言學練課程
解決困擾你多年的C語言疑難雜癥特性的C語言進階課程
從零到寫出一個爬蟲的Python編程課程
只會語法寫不出代碼?手把手帶你寫100個編程真題的編程百練課程
信息學奧賽或C++選手的 必學C++課程
藍橋杯ACM、信息學奧賽的必學課程:算法競賽課入門課程
手把手講解近五年真題的藍橋杯輔導課程