我是用钉钉邮箱做账号登录Power BI Desktop的。我用Power BI Desktop,做排版和统计。
Power BI由Power Query和Power Pivot组成,前者有M语言,后者有DAX。Power Query分步骤操作,可以对步骤进行引用。DAX动态变化,统计能手。
表,有字段工号、部门、姓名、计划离职日期,排版成两个表,其一按计划离职日期10个姓名一行,其二按部门10个姓名一行。第一步,分组后加索引,从零开始。第二,除法取整、取余为行和列的编号。第三步,透视不聚合。复杂点再加上分组计数、求和等。
物流UPS发来的账单,是Excel和PDF的压缩包,要从PDF中提取账单的分类、金额、日期、截止日期。这时Power BI Desktop就发挥作用了,把数据源设为PDF。
在Trello上做的看板,可以导出为JSON,导出为Excel要收费。我用PowerBI Desktop 来提取Card,并统计下Card的数量。
表,有字段工号、部门、姓名、入职日期、离职日期、生日,统计下每月在职人数、入职人数、离职人数、青年人数、短期招聘人数。用Power BI Desktop写measure。第一步,建立日期表,我用calendarauto函数。第二步,把离职日期为空的替换为9999-12-31,当然,你也可以替换为9999-1-1、9999-9-9,方便后面的比较筛选。第三步,计算在职人数、入职人数、离职人数。第四步,计算年龄、青年人数、短期招聘人数。第五步,加筛选,控制日期段。
计算年龄,简单粗暴的方法就是两个年份直接减,科学的方法就是用yearfrac函数慢慢算,看你的需求。
爬虫的话,试过抓取www.cmfu.net几本书的粉丝榜,大致了解销售形势。初始,cmfu是公开粉丝榜以刺激销量,然后被爬虫抓了个遍,泄露了商业机密。然后只公开前十页,再后来只显示粉丝等级和前500名。
收到考勤表后,含日期分组统计打卡的min、max,即每日第一次打卡和最后一次打卡,然后不含日期分组统计前者的max、min,即第一次打卡的最晚和最后一次打卡的最早。另外含日期分组统计打卡的count,一般情况为偶数。