来自微软的嘉奖
公司新闻
合作伙伴关系
联系我们

  快速抓取网页数据并导入微软CRM 2016-6-27 23:51:24
 

 所用技术: PowerShell + 微软CRM

全自动或半自动 :全自动需要网页可以直接抓取,没有复杂的二次验证之类的,数据导入直接在程序里面做,由于有些情况需要人为干预,如网页的二次验证之类的,并且抓取的数据通常会有些错误和重复,并且可能会存在CRM中没有的字段和选项等,这样子可以通过半自动化来做,就是手动的执行一些步骤,如二次验证,数据整理,数据导入。


步骤:

  1. PowerShell执行IE DOM 来操作获取数据;

  2. 存放到数组中,有必要的话操作DOM点击下一页跳转页面来获取新数据等等;

  3. 将数组存到CSV文件中;

  4. 用Excel打开CSV文件,并用EXCEL处理数据(重复错误等);

  5. 通过标准数据导入功能导入微软CRM选择或新建实体,选择或新建字段,映射、忽悠或创建选项);

  6. 通过微软CRM来查看并处理导入问题;

     


解释:PowerShell执行IE抓取网页数据可能会有一些错误和不好处理的东西,会产生重复、错误等,并且PowerShell批量创建数据时间长,中途出错不好跟踪修复,选择后期通过EXCEL处理完数据后再通过微软CRM自带数据导入功能导入,过程中可以创建相关实体字段信息用以来完整保存抓取到的有用的数据。


如果要用PowerShell直接执行CRM数据相关操作的话,用

https://github.com/seanmcne/Microsoft.Xrm.Data.PowerShell

会非常快。

 

细节:

$ie = New-Object -ComObject InternetExplorer.Application

$ie.Visible = $true;

$ie.Navigate("http://profile.alibaba.com/receive_list.htm");

$ie.Document.getElementById(“");

getElementsByTagName("");

getElementsByClassName("");

...

 

相关:

由于阿里巴巴后台的名片数据不能直接导出,所以写了一个简单的PowerShell程序把4K多的名片数据导入到微软CRM中。

 

 

 

 

探索瀚资
解决方案 行业 服务 客户案例 关于瀚资 活动登记
Microsoft-Dynamics-ERP
Microsoft-Dynamics-CRM
本地化包和语言包
医疗保健-生命科学行业
生产制造
零售行业
食品制造
咨询服务
实施服务
支持服务
瀚资其他服务
维益食品
耐克森线缆
开德阜物流
方太厨房电器
华讯工业
欧派门业
来自微软的嘉奖
客户案例
公司新闻
合作伙伴关系
联系我们
活动登记

沪ICP备16028675号-1