中国有多少叫张小涛的?

松玥成松玥成最佳答案最佳答案

这个需要大量数据,所以我从百度上找了一个工具,通过它我分析了以下问题: 中国有多少人姓张 有多少人姓小 有多少人姓涛 中国姓名为“张三”的有多少人 张三占中国人口的比例是多少 这道题的答案其实就隐含在这个工具里面,下面就是具体步骤。(为了便于演示,特地把名字改成了中文名) 在浏览器中打开这个工具,进入首页 输入姓名,可以看到该姓名的人数 下面这张图显示了姓氏“张”的得票情况 可以看出,“张”是排在第一位的中国姓,所以回答第一个问题的答案是,中国有多少人姓张——据当前搜索结果,姓氏“张”的人口数大约占全国人口的7.1%,也就是一千个人中就有七个姓“张” 接下来回答第二个问题,有多少人姓小,有多少人姓涛。

在地址栏输入baidu.com/search/names?q=小+涛&o=0&pr=0&sa=U&ie=UTF-8&r=23&e=m%3D0l%26k%3D小%2B涛 点击搜索,出现的结果如图所示 由于百度做了过滤处理,无法看到完整的结果,但根据我的观察,以“小涛”为姓的人大约有500万,以“小”、“涛”单字作为这个名字的人分别有数百万人。 第三个问题就比较有意思了,这个问题问的是“张三”这个人名的出现频率。 其实这是一个文字游戏,因为这个问题实际上问的是“张三字串”出现频率。

百度支持字数组合搜索,因此我们可以把姓“张”的人和名字中带“三”或带“张”的人都找出来,然后计算这两个集合的交集,这样就可以得到姓名中含有“张三”的文字串人数了。 首先找到所有的姓“张”的人 可以看到有90,401人 接着找出所有名字中含有“三”的人 由于数据量太大,不一一截图了,大概有500多万人 最后算出姓名中含有“张三”文字串的人数 注意这里使用的是交集,因此只考虑了姓名中一个字符串的位置,如果这个字符串在其他地方(比如别名)也出现,则不算在内。这样最准确,也最耗时。如果用并集,则可以省掉很多工作量,但是并集中同一个姓名多次出现的情况会被重复计算,可能造成错误的结论。

我来回答
请发表正能量的言论,文明评论!