阅读csv方向的熊猫

嘿,我试图读熊猫的CSV文件,你可以从这里下载(euribor费率我想你可以想象我想要这个文件的原因!)。 该文件是一个CSV文件,但它以某种奇怪的方式。 如果您在Excel文件中导入它具有该格式

   02/01/2012,03/01/2012,04/01/2012,,,, 
1w 0.652,0.626,0.606,,,,
2w,0.738,0.716,0.700,,,,

与第一列一起行动到12米(但我已经给你链接,你可以下载一个样本)。 我想用熊猫阅读它,但我无法以正确的方式阅读它。 熊猫有一个内置的读取csv文件的功能,但不知何故它期望以行为导向而不是以列为导向。 我想要做的是获得标记为3m的行上的信息并且具有值和日期以绘制该索引的时间变化。 但我无法处理这个问题。 我知道我可以用数据读取数据

import pandas 
data = pandas.io.read_csv("file.csv",parse_dates=True) 

但它会工作,如果csv文件将以某种方式转置。 H


熊猫数据框有一个.transpose()方法,但它不喜欢这个文件中的所有空行。 以下是如何清理它的方法:

df = pandas.read_csv("hist_EURIBOR_2012.csv")  # Read the file
df = df[:15]    # Chop off the empty rows beyond 12m
df2 = df.transpose()
df2 = df2[:88]  # Chop off what were empty columns (I guess you should increase 88 as more data is added.

当然,你可以将这些链接在一起:

df2 = pandas.read_csv("hist_EURIBOR_2012.csv")[:15].transpose()[:88]

然后df2['3m']是你想要的数据,但是日期仍然以字符串形式存储。 我不太确定如何将其转换为DateIndex


我从来没有使用熊猫进行csv处理。 我只是使用标准的Python lib csv函数,因为它们使用迭代器。

import csv
myCSVfile=r"c:/Documents and Settings/Jason/Desktop/hist_EURIBOR_2012.csv"
f=open(myCSVfile,"r")
reader=csv.reader(f,delimiter=',')
data=[]
for l in reader:
    if l[0].strip()=="3m":
        data.append(l)

f.close()
链接地址: http://www.djcxy.com/p/59385.html

上一篇: pandas reading csv orientation

下一篇: How to tell Proguard to obfuscate class names