用于业余项目的优秀 Python 库

2023-12-13 4:52:03 网络知识 匿名

1.在数据库中即时保存数据:Dataset

当我们想要在不知道最终数据库表长什么样的情况下,快速收集数据并保存到数据库中的时候,Dataset库将是我们的最佳选择。Dataset库有一个简单但功能强大的API,因此我们可以很容易的把数据保存下来,之后再进行整理。

Dataset建立在SQLAlchemy之上,所以如果需要对它进行扩展,你会感到非常熟悉。使用Django内建的inspectdb管理命令可以很容易地把底层数据库模型导入Django中,这使得和现有数据库一同工作不会出现任何障碍。

2.从网页抓取数据:BeautifulSoup

BeautifulSoup(一般写作BS4)库使得从HTML网页中提取信息变得非常简单。当我们需要把非结构化或弱结构化的HTML转换为结构化数据的时候,就需要使用BeautifulSoup。用它来处理XML数据也是一个很好的选择,否则XML的可读性或许会很差。

3.和HTTP内容打交道:Requests

当需要和HTTP内容打交道的时候,Requests毫无疑问是最好的标准库。当我们想要抓取HTML网页或连接API的时候,都离不开Requests库。同时,它也有很好的文档。

4.编写命令行工具:Click

当需要写一个简单的Python脚本作为命令行工具的时候,Click是我最喜欢用的库。它的API非常直观,并且在实现时经过了深思熟虑,我们只需要记住很少的几个模式。它的文档也很优秀,这使得学习其高级特性更加容易。

5.对事物命名:PythonSlugify

众所周知,命名是一件困难的事情。PythonSlugify是一个非常有用的库,它可以把一个标题或描述转成一个带有特性的唯一标识符。如果你正在做一个Web项目,并且你想要使用对搜索引擎优化友好(SEO-friendly)的链接,那么,使用PythonSlugify可以让这件事变得很容易。

6.和插件打交道:Pluggy

Pluggy库相对较新,但是如果你想添加一个插件系统到现有应用中,那么使用Pluggy是最好也是最简单的方式。如果你使用过pytest,那么实际上相当于已经使用过Pluggy了,虽然你还不知道它。

7.把CSV文件转换到API中:DataSette

DataSette是一个神奇的工具,它可以很容易地把CSV文件转换为全特性的只读RESTJSONAPI,同时,不要把它和Dataset库混淆。Datasette有许多特性,包括创建图表和geo(用于创建交互式地图),并且很容易通过容器或第三方网络主机进行部署。

8.处理环境变量等:Envparse

如果你不想在源代码中保存API密钥、数据库凭证或其他敏感信息,那么你便需要解析环境变量,这时候envparse是最好的选择。Envparse能够处理环境变量、ENV文件、变量类型,甚至还可以进行预处理和后处理(例如,你想要确保变量名总是大写或小写的)。

以上内容为大家介绍了用于业余项目的优秀Python库,希望对大家有所帮助,如果想要了解更多Python相关知识,请关注IT培训机构:瀚银百科。http:////

发表评论: