一个关于Define.xml的奇怪问题

今天一个同事和我说,她在做Define.xml时碰到一个奇怪的问题:最后要生成Define.xml的数据集中已经去除了各种特殊字符,但是生成的Define.xml文件有些地方仍然会有空格(经查询为‘ODOA’x即回车和换行符),见下图:

Define

0A0D

接着看了下她的程序:

Code

发现以上程序没有问题,一开始我也觉得奇怪,仔细想了下,发现原来是PUT语句搞的鬼,原来PUT语句一行最多可以写255个字符串,所以对于长度超过255的行会自动PUT成多行,这样就会导致最后的Define.xml有回车和换行符了。

对于这个问题,又要用到强大的正则表达式了,即将变量LINE每隔固定的长度(这里取200)插入一个分隔符,然后生成多行,这样再PUT就不会出问题了。代码如下:

data xmlall;
    set xmlall;
    LINE=prxchange("s/(.{1,200})([\s]|$)/\1@/", -1, cats(LINE));
    LINE=prxchange('s/(.+)\@/\1/', -1, LINE);
    i=1;
    do until(scan(LINE, i, '@')='');
        LINE_=scan(LINE, i, '@');
        output;
        i+1;
    end;
    drop LINE;
    rename LINE_=LINE;
run;
曾宪华 /
本文采用 署名-非商业性使用-相同方式共享 3.0许可协议 属于 程序人生 分类, 被贴了 CDISC Define.xml PRXCHANGE Regular Expression 正则表达式 书签

上一篇 创建SAS Format的几种方法
下一篇 认识Annotate Facility