把整条链塞进Excel:比特币链上数据CSV下载,区块高度、时间戳、体积字段一次薅干净
把整条链塞进Excel:比特币链上数据CSV下载,区块高度、时间戳、体积字段一次薅干净
想熬夜盯盘却被K线耍得团团转?不如直接扒比特币链上原始CSV,把区块高度、时间戳、体积字段拖进表格,自己算抛压、自己看拥堵。下文就给你一条不用写代码、不装节点、不翻墙的捷径,顺带把坑全标红。
为什么要下CSV,而不是看浏览器?
区块浏览器点两下确实能看高度、时间、大小,可它不会告诉你:连续六个区块体积飙到3.8 MB 以上,往往意味着接下来手续费要疯涨。CSV把整月数据一次性扔给你,拉个折线图,拐点比任何社群“内幕”都准。再说回测策略,没有本地文件,难道靠手抄?
三个字段到底能干啥
区块高度:当行号用,方便vlookup去关联难度、手续费数据。
时间戳:UTC时间,记得+8才是国内盘感,别把时间错配到美股开盘。
体积(size):单位是字节,直接除以两次1024就是MB,一眼看出是否打满上限。
把三列拖进透视表,行标签选日期,值域放“体积平均值”,立刻看到每周二上午区块最肥,矿工最爱在这时候挤交易,套利窗口自己跳出来。
数据源对比:谁免费、谁限速、谁耍流氓
1. Blockchair:HTTP直链,单次五十万行,限速每秒一次,注册送密钥可白嫖。
CryptoQuant:给的是打包文件,高度到最新,但时间戳被四舍五入到分钟,高频党慎入。
自建节点打RPC:getblock 遍历,数据最原生,可硬盘要1T起步,宽带低于500兆就别折腾。
实测用Blockchair拉去年全年,Python十行脚本,挂机三小时搞定,CSV解压后不到8G,老笔记本也能拖得动。
零代码下载流程
① 打开Blockchair官网,顶部菜单选“Export”。
② 在Bitcoin栏打勾,输入起始高度,例如“800000-810000”。
③ 字段只勾“id、timestamp、size”,别手痒全选,多了三倍流量。
④ 点“Request file”,邮箱收到下载链接,大约十分钟。
⑤ 解压得到csv,用Excel Power Query直接加载,省得乱码。
想自动化,就把链接拼成:
https://gz.blockchair.com/bitcoin/blocks/blockchairbitcoinblocks800000810000.tsv.gz
把高度区间换成变量,wget循环,夜里跑完自动关机。
清洗三板斧:去重、补时差、算增速
1. 去重:同一高度可能因回滚出现两次,保留时间戳最大的那一行。
补时差:新建列“ Beijing_time ”,公式=时间戳+8/24,单元格格式选“yyyy-mm-dd hh:mm”。
算增速:新增“size_growth”,公式=(本行体积-上一行体积)/上一行体积,条件格式>30%标红,一眼识别出“巨块”。
做完这三步,数据就能喂给量化软件,回测均线突破、波动率聚集都不卡壳。
体积字段的隐藏彩蛋
很多人扫一眼大小就关表,其实把体积除以交易笔数,能得到平均交易体积。该数值突然飙高,往往是大户批量归集;连续走低,说明网络被小额转账挤满,手续费即将起飞。去年两次“平均体积跌破五百字节”后,次日矿工费均翻倍,信号稳得可怕。
常见翻车点
• 直接双击CSV默认用Excel打开,会把时间戳科学计数,补救办法是数据→自文本导入,手动把列设成文本。
• 忘记关科学上网,下载到一半被重置,文件断成两截,校验MD5对不上,只能重头来。
• 把体积当容量,误用十进制单位,结果算出3.99 MB 被误判为超出上限,其实是四舍五进位问题,记住计算机只认1024。
进阶:把CSV接进实时仪表盘
Excel 365 有“数据类型”功能,把高度列绑定到Power BI数据集,体积字段设条件格式,背景色随区块大小渐变。再插个切片器选日期,鼠标一拖就能看任意时段的链上拥堵,比盯浏览器刷新省眼一万倍。Mac 党用Numbers也行,导出CSV后拖进原生图表,风扇都不带转。
别被花哨指标绕晕,区块高度、时间戳、体积三列数据就是比特币链上最锋利的手术刀。学会下载、清洗、透视,你不仅能提前嗅到手续费暴动,还能把回测精度直接拉满。工具摆在这儿,今晚就能跑第一行代码。