前几天在微信群里看到一个问题:求一个数组的子集。SAS中实现排列的方法有多种,最易懂的方法应该是PROC SUMMARY以及CALL ALLCOMB,两种方法的代码在这里。下面介绍一个DATA步一步到位的方法:
data subsets;
array set1[*] $ a b c d e ('a', 'b', 'c', 'd', 'e');
array set2[*] bin1-bin5;
array set3[*] $ ele1-ele5;
do i=0 to dim(set1)-1;
set2(i+1)=2**(dim(set1)-(i+1));
end;
do j=0 to 2**dim(set1)-1;
call missing(of ele:);
do i=1 to dim(set1);
if band(j, set2(i)) then set3(i)=set1(i);
end;
SUBSETS=cats(of ele:);
keep SUBSETS;
output;
end;
run;
简单说下上面方法的思路,我们知道一个具有n个元素的集合的子集个数是2的n次方,因为每个元素只有出现和不出现两种情况。首先将数组元素转换成二进制值,‘abcde’对应的值为‘00011111’,各元素对应的值分别为:2的4次方16,2的3次方8,2的2次方4,2的1次方2,2的0次方1。然后用函数BAND将数字0-31(0代表空集)分别和各元素做位运算,返回结果为真则将元素值赋值给新的数组,最后将新数组连接起来即为子集。