Python网络爬虫基础
主要章节
11项目(教学模块),73节(教学任务)|建议课时:60课时|建议学分:4学分
教学资源
  • 授课资源11套;
  • 实训设计22个;
  • 课后练习5套;
  • 拓展学习资料2份;
主要章节
  • 认识网络爬虫
  • 网页请求原理
  • 抓取静态网页数据
  • 解析网页数据
  • 抓取动态网页数据
  • 提升网络爬虫速度
教学目标
知识目标
  • 熟悉网络爬虫的概念及分类,能够归纳通用网络爬虫和聚焦网络爬虫的区别
  • 了解网络爬虫的应用场景,能够列举至少3个网络爬虫的应用场景
  • 熟悉网络爬虫的Robots协议,能够说明robots.txt文件中每个选项的含义
  • 熟悉防网络爬虫的应对策略,能够列举至少3个应对防爬虫的策略
  • 掌握网络爬虫的工作原理,能够定义通用网络爬虫和居家网络爬虫的工作原理
  • 熟悉网络爬虫的工作流程,能够归纳网络爬虫抓取网页的完整流程
  • 了解网络爬虫的实现技术,能够说出使用Python实现网络爬虫有哪些优势
  • 熟悉网络爬虫的实现流程,能够归纳使用Python实现网络爬虫的流程
技能目标
  • 了解解析网页的技术,能够说出正则表达式、XPath、Beautiful Soup与JSONPath的特点
  • 熟悉正则表达式的语法,能够归纳元字符与预定义字符集的函数以
  • 掌握re模块的用法,能够灵活应用re模块解析网页数据
  • 了解XPath的概念,能够说出XPath的路径表达式的搜索方法
  • 掌握XPath的语法,能够根据需要编写XPath的路径表达式
  • 掌握XPath的语法,能够根据需要编写XPath的路径表达式
  • 熟悉Beautiful Soup,能够归纳Beautiful Soup包含的类基本用法
  • 掌握Beautiful Soup类的对象的创建方式,能够使用Beautiful Soup类的构造方法创建Beautiful Soup类的对象
知识结构
教学场景
  • 课前预习

    课前知识引导,通过线上微课、视频资料完成课前自我学习

  • 课堂讲解

    教师完成教学重点、难点讲解,学生完成知识分享讲解

  • 课堂互动

    课堂上完成投票、调研、提问等线上和线下师生互动,活跃课堂氛围

  • 课堂活动

    课堂沙龙、小组PK,多种活动形式引导学生主动学习

  • 实训实战

    借助仿真环境、实战平台、真实业务环境实现技能训练和知识点验证

  • 考试考核

    随堂测试、单元测试、综合考试多种测评形式

  • 课后拓展

    拓展资料、课后实训、课后实战延伸学习时间和空间

教学设计

课程共包含19个课堂活动,包括案例分析、课堂分享、体验实训、仿真实训、等活动形式,支撑对应知识点学习、技能训练、思维训练、综合素质培养。

  • 1
    适用课堂教学

    理论方法

  • 2
    适用课堂互动、案例解析

    知识导入

  • 3
    适用于课堂实训

    方法技巧

  • 4
    适用于仿真实训、项目实战

    实践技能

联系我们
  • 服务热线

    400-670-2880

  • 客服QQ

    1712988131

  • 商务合作

    18612571688 (王经理)

  • 在线咨询

京慧越微信公众号