打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
Windows 系统 Unicode 文件名操作(新建、重命名、枚举、复制)全攻略
环境 XP/WIN7 Active Perl v5.16
编辑整理:523066680
原帖:http://code-by.org/viewtopic.php?f=17&t=131
以下主要讨论用 ActivePerl 自带的模块的处理方法
由于常见的那些文件操作函数都不支持,为了达到目的,需要各种方法配合。
以下脚本代码均保存为 utf8 编码格式。
文件的建立
模块: WIN32
use Win32;
use utf8;
#接受unicode传参
Win32::CreateFile("W32CreateFile・测试");
特性: 成功时返回true,但不返回文件句柄
Creates the FILE and returns a true value on success.
Check $^E on failure for extended error information.
模块:Win32API::File
函数:$hObject= CreateFileW( $swPath, $uAccess, $uShare, $pSecAttr, $uCreate, $uFlags, $hModel )
$hObject 即为文件句柄(对象)
注意事项:传入的文件路径的编码格式为:UTF16-LE ,必须以\x00结尾。
示例代码:
use Win32API::File qw(:ALL);
use utf8;
use Encode;
$str="文tes・t.txt\x00";
$hobject=CreateFileW(encode('UTF16-LE', $str), GENERIC_WRITE, 0, [], OPEN_ALWAYS,0,0);
目录的建立
模块:Win32
use Win32;
use utf8;
Win32::CreateDirectory("Dir・测试");
枚举文件(臧廷杰)
在遇到unicode字符的时候,File::Find模块 以及 IO::Dir 模块都只能输出文件短名。
但是可以通过 `CMD /U Dir /s /b` 的方式获取,/U参数允许命令行以Unicode形式输出。
参考文章
[how to read unicode filename](http://www.perlmonks.org/?node_id=536223)
复制某个文件夹内的文件
模块:Win32API::File
如果先获取文件的短名,然后再复制,目标文件名也会变成短名。
可先用 cmd /U 模式获取文件列表,然后CopyFileW进行复制:
use Win32API::File qw':ALL';
use Encode;
use utf8;
my $src=encode('gbk','.\\测试目录');
my $dst='.\\Target';
#该目录只有一层,/s开关是为了列出完整的路径
my $all=`cmd /U /C dir /s /b \"$src\"`;
my $fn;
for (split(/\x0d\x00\x0a\x00/, $all))
{
$fn = encode('gbk', decode('utf16-le',$_))."\n";
@xrr = split(/\x5c\x00/, $_);
CopyFileW(
$_ ."\x00",
encode('utf-16le', decode('utf8', "$dst\\")).$xrr[$#xrr]."\x00",
1
);
print "$^E\n" if ($^E);
}
这里有几个注意事项
细节一、
正确地使用 split $all 截断utf-16le字符段落,分隔符应为0d 00 0a 00
细节二、
如果用 basename() 分割路径,同样会遇到00被忽略的问题,'\\' 的U16LE
编码是5C 00,但是basename 只按5C截断,剩下的00造成了处理乱码。
测试basename的第二个参数设置为 "\x5c\x00" 并不能解决这个问题
解决方法
手工去掉开头处的 \x00
或者:
@xrr=split(/\x5c\x00/, $_);
细节三、
CopyFileW复制文件时,要在末尾加\x00作为字符串终止符,否则各种问题=_=
判断文件是否存在
方法一:先转为短名再判断,不做赘述
方法二:渣方法,用CreateFileW测试建立同名文件,看是否有冲突
重命名
模块:Win32API::File
MoveFileW(
encode('utf-16le', decode('utf8',$F))."\x00",
encode('utf-16le', decode('utf8',$newname))."\x00"
);
获取文件的日期信息
普通文件名的情况
[how-can-i-get-a-files-modification-date-in-ddmmyy-format-in-perl](http://stackoverflow.com/questions/1839877/)
含有Unicode字符的文件名的情况
[How to stat a file with a Unicode (UTF16-LE) filename in Windows?](fhttp://www.perlmonks.org/?node_id=741797)
其中的方法是通过createfileW 获取文件句柄,然后用OsFHandleOpen获取通用的文件句柄对象,并传入state
(感觉特别绕)
另一种就是先转为短名再获取日期,但是这种方法在处理文件量大的时候,效率非常低。
前面 perlmonks 中的方法效率要高得多
use utf8;
use Encode;
use Win32;
$filename='D:\测试目录\董贞 ・ 01.剑如虹.[贞江湖].mp3';
$filename=Win32::GetShortPathName($filename);
my $mtime = (stat $filename)[9];
my($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime($mtime);
$year+=1900;
$mon+=1;
print "$year-$mon-$mday\n";
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
PHP与UTF
UTF-8, UTF-16, UTF-16LE, UTF-16BE的区别
中文文件下载失败的前因后果
Web基础了解版12-上传下载
Python2.7字符编码详解
编码歪传在Windows上做开发的同学,一定要选择“使用UTF-8无BOM格式”保存
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服