和LP说起我在琢磨R,这东西有很强的数据处理能力。LP在她公司的财务部门工作。我告诉她如果有什么数据处理分析类的工作可以让我给她写程序做,原来利用Excel手工做的一些事情,现在或许可以较方便地用R来处理。
LP说好啊,她正在做固定资产清理,有一个包含几万条记录的Excel表,现在需要分发到各个下级单位分别补充信息、盖章确认、反馈汇总。手工拆成上百个文件比较费劲,而让各个单位筛选填写自己的数据又担心有操作错误出现遗漏。如果程序可以实现自动拆分的功能就好了。
我想起R的数据输出输入功能有xlsx等包,而数据筛选又是很简单的事情,于是马上说可以做。我盘算着数据文件应该是一个标题行和几万个数据行组成,这样我只要读入xlsx文件,然后根据单位字段筛选出子集,再输出到不同的文件中,这样就大功搞成了。
一、实际需求
打开她的工作xlsx文件,发现情况和所想的有区别。
1.文件上方有一个旋转透视表,用于汇总数据结果。这个表在每个分拆开的文件中都要有。2.子集不是从第一行开始,而是从旋转透视表的下方指定某行开始。数据要含表头。3.拆分时要按照一级单位建立目录(十几个),并在一级单位的目录中按照二级单位生成文件(上百个)。这样就可以按照一级单位的目录
