新浪博客

解决stata的dta数据文件中文字符变量乱码问题

2021-01-08 21:55阅读:
假设数据集为A.dta
dta文件中的中文字符变量在Stata中打开后是乱码
这是Stata不同版本对中文字符编码翻译采用了不同标准导致的
操作步骤如下:

先清除目前的乱码数据
· clear


然后,将需要编码的文件,放入当期工作路径(current working directory),通常在Stata的左下角显示。
  
使用命令 unicode analyze 分析数据集 A.dta 是否需要编码翻译。


  . unicode analyze A.dta
  

  如果结果显示,有一个字符串变量需要编码翻译(1 str# variable needs translation)则将编码设为国标码(GB18030),再进行翻译。

  . unicode encoding set gb18030
  (default encoding now gb18030)


  . unicode translate A.dta
  (using gb18030 encoding)
  
  结果显示,此文件已编码翻译成功。

  再次打开此数据集,并通过数据编辑器 “Data Editor (Browse)” 查看,即可得到正常显示无乱码的数据集。

我的更多文章

下载客户端阅读体验更佳

APP专享