如何在Windows下使用mingw打开ifstream文件的unicode文件?
请注意,这与使用unicode文件名打开std :: fstream(ofstream或ifstream)不同。 这个问题是关于一个unicode 文件名 ,这个是关于一个unicode文件的内容 。
我需要用ifstream打开一个UTF-8 unicode文件(包含西班牙文字符)。 在Linux下这是没有问题的,但是在Windows下它是。
bool OpenSpanishFile(string filename)
{
ifstream spanishFile;
#ifdef WINDOWS
spanishFile.open(filename.c_str(),ios::binary);
#endif
if (!spanishFile.is_open()) return false;
spanishFile.clear();
spanishFile.seekg(ios::beg);
while (spanishFile.tellg()!=-1)
{
string line="";
getline(spanishFile,line);
//do stuff
cout << line << endl;
}
return true;
}
我在Linux下编译它:
i586-mingw32msvc-g++ -s -fno-rtti test.cpp test.exe
然后在wineconsole test.exe
运行它。
输出包含各种奇怪的字符,所以它会尝试打开unicode文件,使其不同。
我已经在互联网上搜索了很多关于如何以这种方式打开一个unicode文件,但我无法实现它的工作。
有没有人知道可以与mingw一起工作的解决方案? 提前谢谢你。
很可能(不清楚呈现的代码是否是真正的代码)您看到垃圾的原因是Windows中的std::cout
默认将结果呈现在非UTF-8控制台窗口中。
为了正确检查你是否正确读取UTF-8文件,只需收集一个字符串中的所有输入,将其从UTF-8转换为UTF-16 wstring
,然后使用MessageBoxW
(或宽直接控制台输出)显示该文件。
以下UTF-8→UTF-16转换函数与Visual C ++ 12.0很好地协同工作:
#include <codecvt> // std::codecvt_utf8_utf16
#include <locale> // std::wstring_convert
#include <string> // std::wstring
auto wstring_from_utf8( char const* const utf8_string )
-> std::wstring
{
std::wstring_convert< std::codecvt_utf8_utf16< wchar_t > > converter;
return converter.from_bytes( utf8_string );
}
不幸的是,尽管它只使用标准的C ++ 11功能,但它无法使用MinGW g ++ 4.8.2进行编译,但希望您拥有Visual C ++(毕竟它是免费的)。
作为替代方案,您可以使用Windows API MultiByteToWideChar
编码转换函数。
例如,下面的代码在-D USE_WINAPI
与g ++ 4.8.2很好地-D USE_WINAPI
:
#undef UNICODE
#define UNICODE
#include <windows.h>
#include <shellapi.h> // ShellAbout
#ifndef USE_WINAPI
# include <codecvt> // std::codecvt_utf8_utf16
# include <locale> // std::wstring_convert
#endif
#include <fstream> // std::ifstream
#include <iostream> // std::cerr, std::endl
#include <stdexcept> // std::runtime_error, std::exception
#include <stdlib.h> // EXIT_FAILURE
#include <string> // std::string, std::wstring
namespace my {
using std::ifstream;
using std::ios;
using std::runtime_error;
using std::string;
using std::wstring;
#ifndef USE_WINAPI
using std::codecvt_utf8_utf16;
using std::wstring_convert;
#endif
auto hopefully( bool const c ) -> bool { return c; }
auto fail( string const& s ) -> bool { throw runtime_error( s ); }
#ifdef USE_WINAPI
auto wstring_from_utf8( char const* const utf8_string )
-> wstring
{
if( *utf8_string == ' ' )
{
return L"";
}
wstring result( strlen( utf8_string ), L'#' ); // More than enough.
int const n_chars = MultiByteToWideChar(
CP_UTF8,
0, // Flags, only alternative is MB_ERR_INVALID_CHARS
utf8_string,
-1, // ==> The string is null-terminated.
&result[0],
result.size()
);
hopefully( n_chars > 0 )
|| fail( "MultiByteToWideChar" );
result.resize( n_chars );
return result;
}
#else
auto wstring_from_utf8( char const* const utf8_string )
-> wstring
{
wstring_convert< codecvt_utf8_utf16< wchar_t > > converter;
return converter.from_bytes( utf8_string );
}
#endif
auto text_of_file( string const& filename )
-> string
{
ifstream f( filename, ios::in | ios::binary );
hopefully( !f.fail() )
|| fail( "file open" );
string result;
string s;
while( getline( f, s ) )
{
result += s + 'n';
}
return result;
}
void cpp_main()
{
string const utf8_text = text_of_file( "spanish.txt" );
wstring const wide_text = wstring_from_utf8( utf8_text.c_str() );
//ShellAbout( 0, L"Spanish text", wide_text.c_str(), LoadIcon( 0, IDI_INFORMATION ) );
MessageBox(
0,
wide_text.c_str(),
L"Spanish text",
MB_ICONINFORMATION | MB_SETFOREGROUND
);
}
} // namespace my
auto main()
-> int
{
using namespace std;
try
{
my::cpp_main();
return EXIT_SUCCESS;
}
catch( exception const& x )
{
cerr << "!" << x.what() << endl;
}
return EXIT_FAILURE;
}
链接地址: http://www.djcxy.com/p/54643.html
上一篇: How to open unicode file with ifstream using mingw under Windows?
下一篇: Read/Write file with unicode file name with plain C++/Boost