最近在 GitHub 上看到的仅用这个 MindsDB[1] 项目让我眼前一亮,它可以在数据库里执行机器学习相关的搞机操作,也就是器学说,仅用 SQL 就可以构建、仅用训练、搞机优化和部署机器学习模型,器学要获得预测,仅用只需查询数据和 ML 模型就可以。搞机
MindsDB 通过采用 AI 表的器学概念将机器学习引入数据库。AI 表是作为虚拟表存储在数据库中的机器学习模型。它们有助于根据数据进行预测。你可以在数据库中执行时间序列、回归和分类预测,并通过使用简单的 SQL 语句查询 AI 表几乎立即获得输出。
接下来,我们来看一个官方提供的一个简单示例。
CREATE DATABASE example_data
WITH ENGINE = "postgres",
PARAMETERS = {
"user": "demo_user",
"password": "demo_password",
"host": "3.220.66.106",
"port": "5432",
"database": "demo"
};
执行之后可以得到下面的结果:
Query OK, 0 rows affected (3.22 sec)
CREATE PREDICTOR mindsdb.home_rentals_predictor
FROM example_data
(SELECT * FROM demo_data.home_rentals)
PREDICT rental_price;
执行后:
Query OK, 0 rows affected (9.79 sec)
SELECT status
FROM mindsdb.predictors
WHERE name='home_rentals_predictor';
会得到正在训练或者已完成的状态:
+----------+
| status |
+----------+
| training |
+----------+
或者
+----------+
| status |
+----------+
| complete |
+----------+
SELECT 语句允许你基于特征进行预测,其中特征是用于进行预测的输入变量或输入列。现在来预测一栋带两间浴室的 1000 平方英尺房屋的租金是多少。
SELECT rental_price
FROM mindsdb.home_rentals_predictor
WHERE number_of_bathrooms=2
AND sqft=1000;
得到结果如下:
+--------------+
| rental_price |
+--------------+
| 1130 |
+--------------+
到了这一步,你已经成功地使用 SQL 训练了一个预测模型并获得了预测的数据!
1、自动数据预处理、特征工程和编码
2、分类、回归、时间序列任务
3、无需“传统部署”即可将模型投入生产
4、获取每个预测的模型准确度评分和置信区间
5、可以将 ML 模型与现有数据 Join
6、异常检测
7、模型可解释性分析
8、支持 GPU 训练
支持和以下数据库集成:
仅用 SQL 就可以使用机器学习真的很方便,MindsDB 的技术细节可以访问官方文档[2],如果有帮助请点在看分享给更多的朋友。
参考资料:
[1]MindsDB: https://github.com/mindsdb/mindsdb
[2]文档: docs.mindsdb.com
责任编辑:武晓燕 来源: Python七号 SQL机器学习AI(责任编辑:热点)
亚太卫星(01045.HK)年度纯利减少36.1% 每股盈利24.88港仙
国企混合所有制改革借资本市场“找朋友” 年内409家上市国企参与并购
中洲特材(300963.SZ)发行中签率为0.0168401989% 有效申购倍数为5,938.17213倍
券商发债融资节奏明显加快 年内证券公司已发行短融券3801亿元
西力科技(688616.SH):网上发行最终中签率为0.02967172% 配号总数为96,51,58个