两个吃奶一个添下面视频_人妻第一页香蕉网_欧美xxxx少妇_妺妺窝人体色www婷婷

Dotcpp  >  編程題庫  >  n-gram串頻統(tǒng)計
題目 2971:

n-gram串頻統(tǒng)計

時間限制: 2s 內(nèi)存限制: 192MB 提交: 27 解決: 13

題目描述

在文本分析中常用到n-gram串頻統(tǒng)計方法,即,統(tǒng)計相鄰的n個單元(如單詞、漢字、或者字符)在整個文本中出現(xiàn)的頻率。假設有一個字符串,請以字符為單位,按n-gram方法統(tǒng)計每個長度為 n 的子串出現(xiàn)的頻度,并輸出最高頻度以及頻度最高的子串。所給的字符串只包含大小寫字母,長度不多于500個字符,且 1 < n < 5。

如果有多個子串頻度最高,則根據(jù)其在序列中第一次出現(xiàn)的次序依次輸出,每行輸出一個,如果最高頻度不大于1,則輸出NO。

輸入格式

第一行為n;
第二行為字符串。

輸出格式

輸出最高頻度以及頻度最高的所有子串。若最高頻度不大于1,只輸出一行NO。

樣例輸入

3
abcdefabcd

樣例輸出

2
abc
bcd

提示

樣例中,所有的3-gram是:abc,bcd,cde,def,efa,fab,abc,bcd。最后面的cd不足以形成3-gram,則不考慮。這樣,abc 和 bcd 都出現(xiàn)了2次,其余的只出現(xiàn)了1次。
標簽