作业帮 > 综合 > 作业

python读文件统计次数和求和怎么写?

来源:学生作业帮 编辑:搜搜考试网作业帮 分类:综合作业 时间:2024/08/03 10:38:07
python读文件统计次数和求和怎么写?
有一个文件文件内容如下:
A 1 22
A 1 44
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
.
文件中有三列第一列代表ID,第二列代表类型,第三列代表价格,类型和价格均不固定
我现在想统计
通过第一列和第二列分组求和的值和第一列、第二列分组后第三列的count值
例如
A 1 2 66
A 2 1 33
.
我知道可以用collection的count统计出A第二列代表1的有几个数2有几个
但是不知道怎么分组后求第三列的和
python读文件统计次数和求和怎么写?
#!/usr/bin/env python
# coding: utf-8

import re

patt = re.compile(r"""
    (?P<id>\S+)
    \s+
    (?P<category>\S+)
    \s+
    (?P<number>\d+)
    """, re.I|re.U|re.X)

context = """
A 1 22
A 1 44
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
"""

collects = {}
for m in filter(None, map(patt.match, context.splitlines())):
    d = m.groupdict()
    collects.setdefault((d["id"], d["category"]), []).append(int(d["number"]))

for (id, category) in sorted(collects):
    print id, category, sum(collects[(id, category)])>python -u "baidu.py"
A 1 66
A 2 33
B 1 22
B 3 44
B 4 55
C 1 11
C 4 22
>Exit code:0    Time:0.065
再问: python 3写的? 我2.7的环境运行不了 还有如果是读文本,而且文本里面是以|分割怎么办?
再答: 是python2的版本; 将正则表达式中的\s调整一下即可适应|分隔符号;$ cat data.txt
A|1|22
A|1|44
A|2|33
B|1|22
B|3|44
B|4|55
C|1|11
C|4|22
$ python
Python 2.7.2+ (default, Jul 20 2012, 22:12:53)
[GCC 4.6.1] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> exit()
$ python reparser.py
A -- 1, count:2, summary:66
A -- 2, count:1, summary:33
B -- 1, count:1, summary:22
B -- 3, count:1, summary:44
B -- 4, count:1, summary:55
C -- 1, count:1, summary:11
C -- 4, count:1, summary:22

#!/usr/bin/env python
# coding: utf-8

import re

patt = re.compile(r"""
    (?P<id>\S+)
    [\s\|]+
    (?P<category>\S+)
    [\s\|]+
    (?P<number>\d+)
    """, re.I|re.U|re.X)

collects = {}
with open("data.txt", 'rt') as handle:
    for m in filter(None, map(patt.match, handle)):
        d = m.groupdict()
        collects.setdefault((d["id"], d["category"]), []).append(int(d["number"]))