数据库
信息
数据库集成功能仅在 Crawlab 专业版 中可用。
默认情况下,Crawlab 将收集的数据保存到默认数据库(MongoDB)。然而,Crawlab 的目标是成为一个多功能的网络爬虫管理平台, 这意味着它可以用于管理各种用途的爬虫。因此,它被设计为灵活的,并且可以轻松集成到主流数据库中,以便您可以将抓取的数据存储到您选择的数据库中。
Crawlab 数据库模块类似于一些数据库管理工具,如 DBeaver 或 DataGrip。
支持的数据库
Crawlab 目前支持以下数据库:
我们正在努力添加更多数据库支持,包括但不限于:
数据库管理
Crawlab 提供了一个集中的数据库管理界面,在这里您可以管理您的数据库和数据集合。
创建数据库
您可以通过点击数据库管理界面中的 新建数据库 按钮并输入数据库连接信息来创建新数据库。

更新数据库模式
您可以在 数据库 详细页面的 数据库 标签页中像添加、更新或删除表一样更改数据库模式。

执行查询
您还可以在 数据库 详细页面的 控制台 标签页中执行数据库查询。当您想在代码中运行查询之前测试它们时,这非常有用。

连接到数据库
在 数据集成 部分,您已经学习了如何使用 Crawlab SDK 将数据存储到 Crawlab 以便预览抓取的数据。
数据库模块旨在成为集中式数据库管理界面,您可以在此轻松管理您的数据库和表。此外,您可以在 爬虫 详细页面中选择要存储抓取数据的数据库。
按照以下步骤连接到数据库。
- 在
数据库列表页面中创建一个新数据库。 - 导航到
爬虫详细页面。 - 导航到
数据标签页。 - 选择要存储抓取数据的数据库和表。
