Ruì Qiū

April 9, 2021

不画饼周报 #9

之前练手的 {tarantino} 包通过提交并入选了本周的 R Weekly。上周末写了一篇博文,把 understat.com 的公开数据拎出来做项目,写了一篇大体思路的博文 Visualize expected goals.

有一个想法:如果成品是一张以图片呈现的、不太再乎复现能力的可视化,完全可以用 Figma 这样的设计软件来完成最后一步的打磨。


项目


观点

  • Is Soccer Wrong About Long Shots? | FiveThirtyEight 如果唯数据论影响到了球员场上的决策,就对竞技运动是一种伤害了。现有的 xG 模型还是过于简单化球场上的情势了——同样的射门位置,大家都知道 Arjen Roben 带球蹚两步之后打门更有威胁。很简单,助跑后既能摆脱防守球员的覆盖,又能有更大的射门力量。

故事


工具

  • ggplot2 extensions (tidyverse.org) 虽然大多数时候都是「有需要解决的问题,再去找工具」,但有时候看一下这种罗列了一众工具但 toolbox, 也可以拓宽一下视野。
  • Create a Collection of tidymodels Workflows • workflowsets Max Kuhn 的一个全新 R 包,可以将多个 preprocessors 和 models 排列组合并相互比较,形成一个完整的工作流,并且可以对其进行调节。当然,{workflows} 也与他之前的 {tidymodels} 相兼容。
  • Querybook Pinterest 的大数据 IDE 开源了。

播客


书籍


数据