0%

将XLSX转换为CSV

最近需要使用R来简单地处理一些数据。不过拿到手里的数据文件是Excel格式的(XLSX),而在我的R环境中读取却一直没有成功,于是想到将其转换为CSV格式再进行读取处理。

将XLSX文件转换为CSV文件需要使用xlsx2csv小程序,在Debian上可以方便地使用apt-get来安装:

1
apt-get install xlsx2csv

另外需要一提的就是Debian中还有一个xls2csv小程序,正如其名所示,这个小程序可以将Excel 2007以前的文件转换为CSV格式,但却无法处理XLXS文件。

如果有多个文件需要进行转换操作,可以使用下面的脚本进行批量转换:

1
2
3
4
5
6
for file in $(ls *.xlsx)
do
echo "processing $file ..."
csv_name=$(basename $file .xlsx)".csv"
xlsx2csv $file $csv_name
done

得到CSV文件后,就可以使用R来进行所需要的处理了。