文档
备案
控制台
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
火山杯大赛
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
用户7995843447856
文章
专栏
问答
用户7995843447856
国内外主要的期货、期权交易所LME、HKEX、CME、CBOT 等等逐笔数据、分钟线数据下载分析笔记
数据库
数据采集
数据仓库
那些海量的逐笔成交数据,一个合约一天下来轻轻松松几十万条。痛定思痛,干脆把数据库里能下到的数据种类和字段都捋了一遍,算是给自己做个备忘录,也分享给有同样需求的朋友,别再像我一样踩坑了。数据主要分三大类,颗粒度从细到粗,就像从现场直播到每日新闻摘要。逐笔数据,也叫Tick数据。这是最“碎”的一层,市场每发生一笔交易或报价变动,它就记录一条。数据量巨大,是研究微观市场结构、订单流、盘口动态的必备原料,
5
0
0
0
用户7995843447856
沪深股票阶段集合竞价Tick数据下载数据源分享
数据库
数据采集
昨晚跑因子又把内存给干爆了,一看日志,好家伙,又是Tick数据惹的祸。这东西数据量是真的大,但里面的信息也确实细,今天就跟大家盘盘我常用的几个数据模块,主要是沪深股票这块的,看看里面到底装了啥。先说说最让人又爱又恨的沪深股票阶段Tick数据。这玩意儿记录的是盘中每一笔成交和委托快照,不是那种一分钟一根的K线。数据频率高,信息量自然就大,对硬盘和内存都是考验。它的核心字段大概有这些:| 字段类别 |
2
0
0
0
用户7995843447856
美股期权下载数据源分析经验分享兼容期权tick和分钟日级别含希腊字母波动率
数据库
数据采集
昨晚跑策略又把数据搞混了,真是头大。发现很多人对美股期权的高频数据到底长啥样不太清楚,我自己也是踩过不少坑。今天干脆就着数据库里能下到的那些数据,简单捋一捋,希望能帮到同样在找数据的朋友。先说说最细的逐笔数据(Trade & Quote)。这个就是最原始的每一笔成交和报价的变动记录,数据量巨大,但信息也是最全的。比如你做高频或者想精确分析订单流,这个就绕不开。它里面主要就是两类东西,成交和报价。成
7
0
0
0
用户7995843447856
期货五档tick数据下载教程期权五档高频历史数据以及分钟量化回测下载
数据库
标签体系
数据采集
昨晚跑策略又把服务器内存给干满了,一看日志,好家伙,又是高频数据惹的祸。做量化的朋友应该都懂,数据质量直接决定了策略是印钞机还是碎纸机。今天不聊策略,就聊聊我平时打交道最多的几种数据源,特别是期货期权这块的,给想入门或者正在踩坑的朋友们一个参考。说到数据,很多人第一反应可能就是K线。但真正做高频或者微观结构分析,K线就太粗糙了。你得往下钻,看Level 2,看Tick。这些数据就像市场的显微镜,能
10
0
0
0
用户7995843447856
港股和美股分钟以及逐笔tick本地数据下载和分析
数据库
金融
分析港股分钟级别的行情数据,一般采用本地数据更快,因为绝大部分数据库提供数据量有限制,比如只能一个月的。只有将数据下载到本地才能快速回测,我本地是储存了2011年开始至今的历史数据,所以一般也就是本地回测。今天正好整理一下手头常用的港股和美股历史数据源,主要是分钟线和Tick,给同样在折腾数据的朋友们参考参考,顺便聊聊里面都有啥字段,避免大家踩我踩过的坑。先说分钟数据吧,这个算是比较友好的了,不管
30
0
0
0
用户7995843447856
股票逐笔和十档Tick数据今天就跟大家聊聊这些高频数据包里到底装了些什么
数据库
数据库架构
数据采集
做量化这行已经有好多年了,从一开始自己写代码分析到现在十几个agent共同配合自动分析,中间踩了很多坑。这里我大概总结了一下,数据坑、代码坑、接口坑、agent坑等等,每次好不容易找到了一个稳定的策略,都会遇到数据不稳定,接口不稳定,agent失控等等问题,这里把最重要的问题记个笔记。 数据是整个过程中最重要的,我以前是各种找数据库,最后明白了,找一个稳定的数据源是最重要的。先说说最常被问到的,就
44
0
0
0
用户7995843447856
今天分析最“重”的,也是很多量化朋友最关心的——港股逐笔成交
数据库
分布式数据库
做港股量化,以前是需要一定的量化技术手段,比如需要会脚本编程,会数据分析,会数据爬取等等,还需要一些好的历史数据更新。现在不需要了,现在都是AI时代,只需要用很多的AI组合在一起就可以了。比如一个agent用在分析数据,一个agent用于编码,还有的盯盘,效率比之前高很多。但是有一些问题无法避免,比如数据的基本储存和下载,例如我前段时间做的港股分析程序,用到了很多agent,生产的分析数据磁盘都存
25
0
0
0
用户7995843447856
做了期货这么多年,已经习惯用历史数据复盘了,用的数据也从早期的日线,中间变成分钟,又变成一档tick
数据库
扣子
做了期货这么多年,已经习惯用历史数据复盘了,用的数据也从早期的日线,中间变成分钟,又变成一档tick,最后变成五档level2,由于期货的杠杆高,我有习惯满仓干,遇到琢磨不透的地方,就写脚本反复回测,直到能够有一套适应当前变化的模型,最后先小资金测试,再增大机会,本人的性格也慢慢变得沉稳,从一开始的满仓,到后面小资金测试,合适加仓的习惯,也是无数血汗钱换来的的,接下来就分析一下我用过的数据。 说到
26
0
0
0
用户7995843447856
Level 2高频数据这个“硬盘杀手
数据库
数据采集
Level 2高频数据这个“硬盘杀手”。最近正好在用,顺手整理一下CMES金融数据下载页上那些期货和股票的高频数据到底长啥样,给想折腾的朋友提个醒。先说期货的Level 2五档数据。这玩意儿记录的是交易所快照,每一笔成交后或盘口有变动,它都会记一笔。所以数据量巨大,但信息也全。主要字段看这些:| 字段 | 简单说 | 注意的点 | | :--- | :--- | :--- | | 时间戳 | 精确
10
0
0
0
用户7995843447856
数据主要分两大类,一个是五档行情,另一个是Level 2逐笔
数据库
技术解析
昨晚跑因子又把内存给干爆了,一看原来是Level 2的逐笔数据没处理好。今天就跟大家盘盘这类高频数据到底有啥,以及怎么用代码把它“请”下来。数据主要分两大类,一个是五档行情,另一个是Level 2逐笔。五档行情大家应该熟,就是买卖盘口的前五个价位和挂单量。但高频的五档数据是“快照”,每秒可能有多条,能看出盘口的瞬间变化。Level 2逐笔数据就“碎”多了,它记录每一笔成交和委托的明细。比如你看到一
9
0
0
0
用户7995843447856
今天简单聊聊我常用的几个数据源代码接口
数据库
分布式数据库
最近在折腾高频策略,发现数据这块真是个大坑。尤其是Tick和Level2,动不动就是几百G,硬盘都顶不住。今天简单聊聊我常用的几个数据源,主要是从CMES金融数据库下载的,给刚入门的朋友。先说说最基础的分钟线数据。这个对回测比较友好,数据量小,格式也简单。一般包含时间、开盘价、最高价、最低价、收盘价和成交量。比如看个5分钟K线,用这个就够了。但分钟线是“总结”过的,真想看市场微观结构,还得是Tic
8
0
0
0
用户7995843447856
搞量化就是搞数据,期货五档tick是各位朋友应该去研究的
数据库
金融
昨晚跑策略回测,内存又报警了。一看果然是Level 2的Tick数据在“作祟”,这玩意儿数据量是真的大,但也是真有用。正好最近在整理资料,就顺手把CMES金融数据库里这些高频数据的情况捋了一下,给同样在挖因子的朋友做个参考。 说到期货高频数据,主要就分两大类:Tick数据和分钟数据。Tick数据是市场每跳动一次就记录一次,信息最全也最“吃”硬盘。分钟数据则是每分钟汇总一次,比如开盘价、最高最低价这
62
0
0
0
用户7995843447856
这个期货数据,藏着哪些高频细节?
数据库
技术解析
最近在研究期货高频策略,发现一个数据源挺全的,把里面的数据结构整理了一下。如果你也在找tick、分钟或日级别的期货期权数据,或许可以参考。这是最细粒度的数据,记录了盘中每一笔报价的变化。主要字段包括:| 字段类别 | 具体内容 | | :--- | :--- | | 基础信息 | 合约代码、交易日、时间戳(精确到毫秒) | | 价格信息 | 最新价、成交量、成交额、持仓量 | | 委托档位 | 买
21
0
0
0
用户7995843447856
手把手拆解期货期权高频数据,这些字段你都用上了吗?
数据库
金融
做量化研究或者高频策略,离不开高质量的历史tick数据。最近在研究市场微观结构,发现一个挺实用的数据源,里面期货和期权的高频数据字段很全,整理出来供大家参考。这份数据是Level-2的快照数据,记录了每一笔订单簿的瞬时状态,对于分析盘口动态、订单流很有帮助。主要包含以下字段:| 字段名 | 说明 | | :--- | :--- | | 时间戳 | 精确到毫秒的行情时间 | | 最新价 | 当前成交
40
0
0
0
用户7995843447856
期货数据指南:分钟线与五档Tick都包含哪些信息?
数据库
金融
做量化或高频策略,数据质量是关键。最近在回测一个期货订单流策略,用到了CMES金融数据库的历史数据,发现它们提供的分钟线和五档Tick(Level 2)结构比较清晰,适合做市场微观分析。如果你也在找这类数据,不妨看看下面这些内容。分钟线是较常用的时间序列数据,通常包含以下基本字段:| 字段 | 说明 | |------|------| | datetime | 时间戳(精确到分钟) | | ope
14
0
0
0
用户7995843447856
A股Level 2数据详解:从逐笔到分钟,究竟能挖到哪些信息?
数据库
金融
很多做量价分析的朋友,经常会接触到“Level 2数据”这个词。但市面上的数据源质量参差不齐,字段也常有缺失。最近在做因子研究时,为了验证一个盘口规律的可重复性,我专门调取了 CMES金融数据库中近一年的A股Level 2历史数据进行回测,也对数据的结构做了比较全面的梳理。如果你也在找这类数据,不妨看看下面的介绍,或许有帮助。数据主要分为三大类:逐笔成交、十档快照和分钟合成数据。1. 逐笔成交数据
63
0
0
0