建议把1分线、5秒线等数据分日或分月保存 - 金字塔软件问题提交 - 金字塔客服中心 - 专业程序化交易软件提供商

以下是引用yanxc在2015/5/4 13:32:59的发言：

怎么可能效率不咋样。

我是复盘几年前的一天两天，结果金字塔把几年的数据都调出来。

显然占用不在一个档次上。

呀怎么说呢二次开发与前置开发时候是不同的，以前只写VBA，现在写python后才体会的。

调用数据其实不是“调用” 有个数据300M，你只要其中连续部分的150M （要是分块就麻烦）。

方法1，一次读取内存后，在对读取变量分析挑出你要的

方法2，依据行读取文件，移动到指定也就是开始段A开始读入到内存存储。但是前面你读取那些也是调入到内存无非就是后来数据把它废弃了。

从效率来说只要内存足够大，方法1比方法2更好。因为默认你可能要是整个数据，然后对整个数据排列，没说下次不用啊，下次要用只要没close到文件变量就在内存。

方法2的问题是你一旦超标了，就是说我要一部分新数据延续下去，则立即就又要重新打开文件在读取一次。不是从上次哪里读取下去，是重新读取。

虽然方法2可以利用指针记忆上次读取位置，但是下次数据申请未必就是这次数据刚好的后续，因此一般避免错误都是重新读取了。

当然我也希望只要给定数据段，毕竟我也要用金字塔定位时间段研究的。但是就我目前编程知识我知道是一次读取后最有效率。

内存操作比对磁盘I/O效率高不是一点。

[此贴子已经被作者于2015/5/4 14:20:10编辑过]

主题：建议把1分线、5秒线等数据分日或分月保存