![Power BI电商数据分析与商业智能(第2版)](https://wfqqreader-1252317822.image.myqcloud.com/cover/86/43738086/b_43738086.jpg)
5.1 静态数据采集
静态数据是指采集的目标数据在网页源码中,而且是一次性加载在网页中的。
例:采集某电商平台商品页面数据。
在亚马逊网站,搜索“连衣裙”,如图5-1所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_43_1.jpg?sign=1739278861-kEBsuXvZaDToErzdFDzMHsJvWUxGIibh-0-d8b6b0947892160d75ef93036506bb59)
图5-1
打开Power BI,单击“主页”选项卡中的“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项,如图5-2所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_1.jpg?sign=1739278861-Mp1tZ2qAtjHK7o3racJfaOrvVXXIbUj3-0-0e94b83cb3eeed2af51bec22446ed87d)
图5-2
弹出“从Web”对话框,将网页链接复制到URL文本框,然后单击“确定”按钮,如图5-3所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_44_2.jpg?sign=1739278861-6TTxD9WXd0AhEBleBN0wDONx6KeR27YU-0-40cc6e975bad36839ee3ac6797d1d375)
图5-3
单击“Web视图”选项卡,再单击“使用示例添加表”按钮,如图5-4所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_1.jpg?sign=1739278861-b0JMBbV9wnrXQ0WC9Q7yDF5DBhxijwdl-0-66ab1db5136be7613f3c43793edaa748)
图5-4
打开“使用示例添加表”对话框,在“列1”的第1行,输入价格“268.79”,选择弹出的第一个参数,如图5-5所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_45_2.jpg?sign=1739278861-gC16UZJJYENt5xQeBPKeN3qiRCiECdIW-0-bf84d93243301f3c3d229749685712e4)
图5-5
按Enter键后,效果如图5-6所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_1.jpg?sign=1739278861-V4cweewfpRLdcCTzVfrU6MkApYFIn238-0-600e2e3e69f94e86e125eef10684fdcd)
图5-6
获取商品的其他数据也使用同样的操作,结果如图5-7所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_46_2.jpg?sign=1739278861-K4idBLpWh9Ph72zUE84DwGyNgd9nmMJ3-0-762782021b7e81797d3d2706f7d432cb)
图5-7
商品数据在“表视图”选项卡的“自定义表[1]”的“表7”中,如图5-8所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_1.jpg?sign=1739278861-5KOYobST0LawVHxekXpazH4IfETnlaCV-0-7c071edebff865874222dc06890d2c04)
图5-8
例:采集休斯敦火箭队球员最新赛季的数据,球员比赛数据如图5-9所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_47_2.jpg?sign=1739278861-TDc1IbY49WBZ8NIcTFElfakqJBJK2jVN-0-28f7c202a0d6770a31dbdfc6415a0dee)
图5-9
在Power BI的“主页”选项卡中,单击“获取数据”下拉按钮,在打开的下拉列表中选择“Web”选项获取网站的数据。
弹出“从Web”对话框,在URL文本框中输入网址,然后单击“确定”按钮,如图5-10所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_1.jpg?sign=1739278861-MkLRrOjg30eLG6eaWKSshIQtkf6DqFXg-0-909cfc3a3905781317209a6bbc434150)
图5-10
在打开的“导航器”对话框中通过“表视图”选项卡可以看到“表1”是目标数据。勾选“导航器”对话框左侧列表中的“表1”,如图5-11所示,再单击“转换数据”按钮进入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_48_2.jpg?sign=1739278861-iOssx1A9WUQqkMtAJjC1eRNlES1B5neF-0-08e58a904345d089728666c8e2a00308)
图5-11
进入Power Query编辑器后,发现有一列空列,在该列名上右击,在弹出的快捷菜单中选择“删除”选项,如图5-12所示,将空列删除。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_1.jpg?sign=1739278861-Dd2RCxLO5YObiTGvSaEM3EzcrF8Kki48-0-3fd4e1e1248c56ce718a19942d714c33)
图5-12
在“主页”选项卡中单击“将第一行用作标题”按钮,如图5-13所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_2.jpg?sign=1739278861-Y8a1UuCAplYAuGHBn9sxEpHWJUH1NsAX-0-7a9f8763f42fc93112bf2e6d81eba95c)
图5-13
筛选球员数据,取消勾选“总计”“全队数据”“对手数据”选项前的复选框,如图5-14所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_49_3.jpg?sign=1739278861-gQtRKOnJmzbRjIkrDS8iMkzptvTsIoXd-0-a5e94fdf56c0933b8f087bf519556960)
图5-14
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮,如图5-15所示,将数据导入BI中。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_1.jpg?sign=1739278861-X9bPvRHo7WvIMUhqRWhDGVHNLdHAl1nv-0-7dbbfc1ecad768e22b1558dc945902eb)
图5-15
加载后,表格中的数据如图5-16所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_50_2.jpg?sign=1739278861-VO0omQAoEuUaRLTrEe9HrLwU4qnlHE1G-0-8a947326b3df3ffac9a452ba353ffa22)
图5-16
例:批量采集球队最新赛季的数据,球队名称及英文缩写如表5-1所示。
表5-1
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_1.jpg?sign=1739278861-W9st3Dpq1Xx4SAPrXboauETURxLpHfVc-0-414ab4e369de45c6e1acc416f32bce7b)
将数据输入Excel工作表之后,在Power BI Desktop界面的“主页”选项卡中单击“获取数据”下拉按钮,在弹出的下拉列表中选择“Excel”选项,如图5-17所示,将数据导入Power Query编辑器。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_51_2.jpg?sign=1739278861-g8mm6rRKqQIlOBM0OgxywFvMrNSz5l56-0-c980c1294cfd84f8be20752bca33a3df)
图5-17
将数据导入Power Query编辑器后,创建URL,在“添加列”选项卡中单击“自定义列”按钮,如图5-18所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_1.jpg?sign=1739278861-EaqkNA3APH0iSu29rvPwasFC6nyfXz3S-0-d5459d75fc3f165f8eb57f73d164a0d4)
图5-18
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_52_2.jpg?sign=1739278861-evdQSVgRo1SnVbVTi3d0odbpKGdM2Dyp-0-cd388e86ce23413c95ecd03bec4a4cad)
图5-19
在打开的“自定义列”对话框的“自定义列公式”文本框中输入“="http://www.stat-nba.com/team/"&[缩写]&".html"”,然后单击“确定”按钮,如图5-19所示。
创建好URL后再次添加自定义列(在“添加列”选项卡中单击“自定义列”按钮),采集URL数据。
在弹出的“自定义列”对话框的“自定义列公式”文本框中输入“=Web.Page(Web.Contents ([URL])){0}[Data]”,如图5-20所示。
M函数说明
Web.Page:以网页的方式加载数据。
Web.Contents:将网页以二进制文件的格式下载。
{0}[Data]:打开网页中的第一张表格,也就是打开本例的“Table 0”。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_1.jpg?sign=1739278861-ms2fGVzeB4SXb0XRzUBCpL03P36WBXVJ-0-204e2993ff3bc119c0a36bedcc543016)
图5-20
单击“确定”按钮后,如果是首次连接该域名,则会提示用户进行数据隐私设置,选择“忽略此文件的隐私级别检查,忽略隐私级别可能会向未经授权的用户公开敏感数据或机密数据”复选框,如图5-21所示。单击“保存”按钮即可采集数据。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_53_2.jpg?sign=1739278861-YeModXkTpeFirDK3em3YKMLmKg9m0zor-0-5dc6846c415071d2e7388ca12a9686fb)
图5-21
展开所有列,空列可以直接取消勾选,并且取消勾选“使用原始列名作为前缀”复选框,如图5-22所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_1.jpg?sign=1739278861-Lyq4hpgxaXcHkqcF1O3rixk5kiY2M0K6-0-7c8e6f87bfccc2ff034908309c32acc3)
图5-22
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_54_2.jpg?sign=1739278861-Rc9zqniSHX5OrKsmWkLiHmoRSaUED4Cs-0-0faca511f2de2904b8688d10181d5055)
图5-23
展开球员数据后,分别取消勾选“总计”“全队数据”“对手数据”复选框,如图5-23所示。
按住“Ctrl”键,将不需要的列选中并右击,在弹出的快捷菜单中选择“删除”选项,如图5-24所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_1.jpg?sign=1739278861-JyBKIYd4XXxh3xXw0Yo6E1uLdOh3gd93-0-d33be042277c9e6b87033331ae9dc017)
图5-24
在Power Query编辑器的“主页”选项卡中单击“关闭并应用”按钮。
加载好的数据如图5-25所示。
![](https://epubservercos.yuewen.com/6CE043/23020640901648106/epubprivate/OEBPS/Images/42250_55_2.jpg?sign=1739278861-VlYeqSi17aJ0CYrum4X9uZZNr9yVfhkZ-0-ac6ed9602c8c50d3f03f8f64394d8bb4)
图5-25