“分类:Englishpod”的版本间的差异

来自linux中国网wiki
跳到导航 跳到搜索
(创建页面,内容为“englishpod”)
 
 
(未显示同一用户的1个中间版本)
第1行: 第1行:
 
englishpod
 
englishpod
 +
 +
https://github.com/guaguaguaxia/english_pod
 +
 +
有所以主持人文本呢
 +
    english_pod/txt/englishpod_0146.txt
 +
 +
 +
本文利用sketch engine的语料库功能,统计了English pod(共365期)的词汇量。
 +
 +
对于主要内容,找到一个含330期节目的文本,在语料库编译之后发现,单词数量为65,973个,而所含词汇量(即出现一次或以上的词汇)为8,628个。这个文本的数量基本跟总节目的数量差不多,所以可以近似认为365期English pod的主要内容的词汇量在9000个左右。
 +
 +
对于主持人讲解的文本,找到一个1到222期的文本,在语料库编译之后发现,单词数量为333,057个,而所含词汇量为10,701个。因为文本只包含了200多期,所以对于365期English pod的主持人讲解部分来说,所含词汇量约为11000到12000(只是估算)。
 +
 +
若把两个文本一起放进语料库统计的话,结果显示,所含的词汇量为14,192个。根据上面的估算,365期English pod的主要内容+主持人讲解,所含词汇量接近15000到16000。
 +
 +
也就是说,听完了这365期并且完全吸收的话,可以学到15000的词汇量,还有数以百计的短语和常用表达。
 +
 +
[https://zhuanlan.zhihu.com/p/158243143 Englishpod的词汇量统计]

2024年4月17日 (三) 07:04的最新版本

englishpod

https://github.com/guaguaguaxia/english_pod

有所以主持人文本呢

   english_pod/txt/englishpod_0146.txt


本文利用sketch engine的语料库功能,统计了English pod(共365期)的词汇量。

对于主要内容,找到一个含330期节目的文本,在语料库编译之后发现,单词数量为65,973个,而所含词汇量(即出现一次或以上的词汇)为8,628个。这个文本的数量基本跟总节目的数量差不多,所以可以近似认为365期English pod的主要内容的词汇量在9000个左右。

对于主持人讲解的文本,找到一个1到222期的文本,在语料库编译之后发现,单词数量为333,057个,而所含词汇量为10,701个。因为文本只包含了200多期,所以对于365期English pod的主持人讲解部分来说,所含词汇量约为11000到12000(只是估算)。

若把两个文本一起放进语料库统计的话,结果显示,所含的词汇量为14,192个。根据上面的估算,365期English pod的主要内容+主持人讲解,所含词汇量接近15000到16000。

也就是说,听完了这365期并且完全吸收的话,可以学到15000的词汇量,还有数以百计的短语和常用表达。

Englishpod的词汇量统计

分类“Englishpod”中的页面

以下125个页面属于本分类,共125个页面。