Linux

Как отсортировать вывод du -h по размеру

Мне нужно получить список вывода, который может читать человек.

Однако у du нет опции «сортировать по размеру», sort не работает с флагом, понятным человеку.

Например:

du | sort -n -r 

Выводит отсортированное использование диска по размеру (по убыванию):

du |sort -n -r

65108   .

61508   ./dir3

2056    ./dir4

1032    ./dir1

508     ./dir2

 

Однако запуск его с флагом, понятным для человека, не выполняет сортировку должным образом:

du -h | sort -n -r

 

508K    ./dir2

64M     .

61M     ./dir3

2.1M    ./dir4

1.1M    ./dir1

Кто-нибудь знает способ сортировки  du -h по размеру? 

 

Ответ 1

Начиная с версии GNU coreutils 7.5, выпущенной в августе 2009 года, sort допускает параметр -h, который позволяет использовать числовые суффиксы, подобные тем, что выдает du -h: 

du -hs * | sort -h

 

Если же использовать сортировку, которая не поддерживает -h, можно установить GNU Coreutils. Например, на старой версии Mac OS X:

rew install coreutils

du -hs * | gsort -h

Из sort руководства:

-h, --human-numeric-sort compare human readable numbers (e.g., 2K 1G)

 

Ответ 2

Есть очень полезный инструмент под названием ncdu, который я использую для поиска и удаления этих надоедливых папок и файлов, которые занимают много места на диске. Он работает в консоли, быстрый и легкий, и имеет пакеты для всех основных дистрибутивов. 

 

Ответ 3

Отсортируйте человекочитаемый вывод du -h с помощью другого инструмента. Например, Perl! 

du -h | perl -e "sub h{%h=(K=>10,M=>20,G=>30);($n,$u)=shift=~/([0-9.]+)(\D)/;

return $n*2**$h{$u}}print sort{h($b)<=>h($a)}<>;"

 

Можно разделить на несколько строк, чтобы поместить на экране, или оставить как есть, он будет работать в любом случае.  

Вывод:

4.5M    .

3.7M    ./colors

372K    ./plugin

128K    ./autoload

100K    ./doc

100K    ./syntax

 

Окончательный результат следующий:

perl -e"%h=map{/.\s/;99**(ord$&&7)-$",$_}"du -h";die@h{sort%h}"

 

Ответ 4

У меня тоже была такая проблема, и сейчас я использую другой способ:

du -scBM | sort -n

 

Это не даст масштабированных значений, но всегда будет отображать размер в мегабайтах. Это не идеально, но для меня это лучше, чем ничего.

 

Ответ 5

Насколько я могу судить,  есть три варианта:

  1. Изменить du для сортировки перед отображением.

  2. Изменить sort для поддержки человечески понятных размеров для числовой сортировки.

  3. Постобработка вывода из sort для изменения базового вывода на понятный   человеку.

Вы также можете сделать du -k и выводить в килобайтах.

Для 3 варианта вы можете использовать следующий сценарий: 

#!/usr/bin/env python

 

import sys

import re

 

sizeRe = re.compile(r"^(\d+)(.*)$")

 

for line in sys.stdin.readlines():

    mo = sizeRe.match(line)

    if mo:

        size = int(mo.group(1))

        if size < 1024:

            size = str(size)+"K"

        elif size < 1024 ** 2:

            size = str(size/1024)+"M"

        else:

            size = str(size/(1024 ** 2))+"G"

 

        print "%s%s"%(size,mo.group(2))

    else:

        print line

 

Ответ 6

Нашел это сообщение в другом месте. Поэтому этот сценарий оболочки будет делать то, что вы хотите, не вызывая du  для этого дважды. Он использует awk для преобразования необработанных байтов в человекочитаемый формат. Конечно, форматирование немного отличается (все печатается с точностью до одного десятичного знака). 

#/bin/bash

du -B1 | sort -nr  |awk '{sum=$1;

hum[1024**3]="G";hum[1024**2]="M";hum[1024]="K";

for (x=1024**3; x>=1024; x/=1024){

        if (sum>=x) { printf "%.1f%s\t\t",sum/x,hum[x];print $2;break

}}}'

 

Запуск этой программы в моем каталоге .vim дает результат:

4.4M            .

3.6M            ./colors

372.0K          ./plugin

128.0K          ./autoload

100.0K          ./syntax

100.0K          ./doc

 

Ответ 7

Эта версия использует awk для создания дополнительных столбцов для ключей сортировки. Она вызывает du только один раз. Вывод должен выглядеть точно так же, как в du.

Я разбил его на несколько строк, но его можно собрать  и  в одну.

du -h |

  awk '{printf "%s %08.2f\t%s\n", 

    index("KMG", substr($1, length($1))),

    substr($1, 0, length($1)-1), $0}' |

  sort -r | cut -f2,3

 

Пояснения:

BEGIN - создает строку для индекса, чтобы подставить 1, 2, 3 для K, M, G для группировки по единицам, если нет единицы (размер меньше 1K), то нет совпадения и возвращается ноль (идеально!).

Выводит новые поля - единицу измерения, значение (для правильной работы альфа-сорта с добавкой нуля, фиксированной длины) и исходную строку.

Проиндексировать последний символ поля размера.

Вытащить числовую часть размера.

Сортирует  результаты, отбросывает лишние столбцы.

Попробуйте без команды cut, чтобы увидеть, что она делает.

Вот версия, которая выполняет сортировку внутри сценария AWK и не требует команды cut:

du -h |

   awk '{idx = sprintf("%s %08.2f %s", 

         index("KMG", substr($1, length($1))),

         substr($1, 0, length($1)-1), $0);

         lines[idx] = $0}

    END {c = asorti(lines, sorted);

         for (i = c; i >= 1; i--)

           print lines[sorted[i]]}'



Ответ 8

Вот пример, который показывает каталоги в более компактной обобщенной форме. Он обрабатывает пробелы в именах каталогов. 

% du -s * | sort -rn | cut -f2- | xargs -d "\n" du -sh

 

53G  projects

21G  Desktop

7.2G VirtualBox VMs

3.7G db

3.3G SparkleShare

2.2G Dropbox

272M apps

47M  incoming

14M  bin

5.7M rpmbuild

68K  vimdir.tgz

 

Сортировка файлов по размеру в МБ:

du --block-size=MiB --max-depth=1 path | sort -n

 

Ответ 9

У меня есть простая, но полезная обертка для du на языке python под названием dutop. Обратите внимание, что мы (сопровождающие coreutils) рассматриваем возможность добавления функциональности для сортировки "человеческого" вывода напрямую.

 

Ответ 10

$ du -B1 | sort -nr | perl -MNumber::Bytes::Human=format_bytes -F'\t' -lane 'print format_bytes($F[0])."\t".$F[1]'

 

Мне начинает нравиться perl. Возможно, вам придется сделать так:

$ cpan Number::Bytes::Human



Ответ 11

Этот фрагмент был заимствован у «Жан-Пьера» с http://www.unix.com/shell-programming-scripting/32555-du-h-sort.html . Можно ли верить ему?

du -k | sort -nr | awk '

     BEGIN {

        split("KB,MB,GB,TB", Units, ",");

     }

     {

        u = 1;

        while ($1 >= 1024) {

           $1 = $1 / 1024;

           u += 1

        }

        $1 = sprintf("%.1f %s", $1, Units[u]);

        print $0;

     }

    '

 

Ответ 12

Используйте флаг "-g":

-g, --general-numeric-sort

              compare according to general numerical value

 

В моем каталоге /usr/local выводится примерно так:

$ du |sort -g

 

0   ./lib/site_ruby/1.8/rubygems/digest

20  ./lib/site_ruby/1.8/rubygems/ext

20  ./share/xml

24  ./lib/perl

24  ./share/sgml

44  ./lib/site_ruby/1.8/rubygems/package

44  ./share/mime

52  ./share/icons/hicolor

56  ./share/icons

112 ./share/perl/5.10.0/YAML

132 ./lib/site_ruby/1.8/rubygems/commands

132 ./share/man/man3

136 ./share/man

156 ./share/perl/5.10.0

160 ./share/perl

488 ./share

560 ./lib/site_ruby/1.8/rubygems

604 ./lib/site_ruby/1.8

608 ./lib/site_ruby



Ответ 13

Нашел это в сети ... похоже, работает нормально:

du -sh * | tee /tmp/duout.txt | grep G | sort -rn ; cat /tmp/duout.txt | grep M | sort -rn ; cat /tmp/duout.txt | grep K | sort -rn ; rm /tmp/duout.txt

 

Ответ 14

du -h | perl -e'

@l{ K, M, G } = ( 1 .. 3 );

print sort {

    ($aa) = $a =~ /(\w)\s+/;

    ($bb) = $b =~ /(\w)\s+/;

    $l{$aa} <=> $l{$bb} || $a <=> $b

  } <>'

 

Ответ 15

Я изучил awk, придумав вчера этот пример. Это заняло некоторое время, но было очень весело, и я научился использовать awk.

Он запускает du один раз, и его вывод очень похож на du -h

du --max-depth=0 -k * | sort -nr | awk '{ if($1>=1024*1024) {size=$1/1024/1024; unit="G"} else if($1>=1024) {size=$1/1024; unit="M"} else {size=$1; unit="K"}; if(size<10) format="%.1f%s"; else format="%.0f%s"; res=sprintf(format,size,unit); printf "%-8s %s\n",res,$2 }'

 

Данный пример показывает числа меньше 10 с одной десятичной точкой.

 

Ответ 16

Вот простой метод, который я использую - низкое использование ресурсов и делает  то, что нужно:

du --max-depth=1 | sort -n | awk 'BEGIN {OFMT = "%.0f"} {print $1/1024,"MB", $2}'

 

0 MB ./etc

1 MB ./mail

2 MB ./tmp

123 MB ./public_html

 

Ответ 17

Если вам нужно обрабатывать пробелы, можно использовать такой вариант:

 du -d 1| sort -nr | cut -f2 | sed 's/ /\\ /g' | xargs du -sh

 

Оператор sed поможет решить проблемы с именами папок, как в Application Support. 

 

Ответ 18

Другое awk решение:

du -k ./* | sort -nr | 

awk '

{split("KB,MB,GB",size,",");}

{x = 1;while ($1 >= 1024) 

{$1 = $1 / 1024;x = x + 1} $1 = sprintf("%-4.2f%s", $1, size[x]); print $0;}'

 

 [jaypal~/Desktop/Reference]$ du -k ./* | sort -nr | awk '{split("KB,MB,GB",size,",");}{x = 1;while ($1 >= 1024) {$1 = $1 / 1024;x = x + 1} $1 = sprintf("%-4.2f%s", $1, size[x]); print $0;}'

15.92MB ./Personal

13.82MB ./Personal/Docs

2.35MB ./Work Docs

1.59MB ./Work Docs/Work

1.46MB ./Personal/Raa

584.00KB ./scan 1.pdf

544.00KB ./Personal/Resume

44.00KB ./Membership.xlsx

16.00KB ./Membership Transmittal Template.xlsx

 

Ответ 19

Вот пример

du -h /folder/subfolder --max-depth=1 | sort -hr

 

Вывод:

233M    /folder/subfolder

190M    /folder/subfolder/myfolder1

15M     /folder/subfolder/myfolder4

6.4M    /folder/subfolder/myfolder5

4.2M    /folder/subfolder/myfolder3

3.8M    /folder/subfolder/myfolder2

 

Можно добавить, | head -10, чтобы найти первые 10 или любое количество подпапок в указанном каталоге.

 

Ответ 20

du -sk /var/log/* | sort -rn | awk '{print $2}' | xargs -ia du -hs "a"

 

Ответ 21

Используйте следующий сценарий bash: 

#!/bin/bash

# File: duf.sh

# list contents of the current directory by increasing 

#+size in human readable format

 

# for some, "-d 1" will be "--maxdepth=1"

du -k -d 1 | sort -g | awk '

{

if($1<1024)

    printf("%.0f KB\t%s",$1,$2);

else if($1<1024*1024)

    printf("%.1f MB\t%s",$1/1024,$2);

else

    printf("%.1f GB\t%s",$1/1024/1024,$2);

}'

 

Ответ 22

Здесь много ответов, многие из которых дублируются. Я вижу три тенденции: пересылка через второй вызов du, использование сложного кода shell/awk и использование других языков.

Вот POSIX-совместимое решение с использованием du и awk, которое должно работать на любой системе.

Я использовал немного другой подход, добавив -x, чтобы убедиться, что мы остаемся в той же файловой системе (мне эта операция нужна только в случае нехватки дискового пространства, так зачем удалять то, что я смонтировал в этом дереве FS или переместил и соединил обратно?) . Отображает последовательный вывод, чтобы облегчить визуальный разбор. В этом случае я обычно предпочитаю не сортировать, чтобы лучше видеть иерархическую структуру. 

sudo du -x | awk '

  $1 > 2^20 { s=$1; $1=""; printf "%7sG%s\n", sprintf("%.2f",s/2^21), $0 }'

 

(Поскольку это последовательный вывод, вы можете добавить | sort -n, если вам действительно нужен отсортированный результат).

Эта команда, отфильтрует любой каталог, чье (суммарное) содержимое не превышает 512 МБ, а затем отображдает размеры в гигабайтах. По умолчанию du использует размер блока 512 байт (поэтому условие awk в 220 блоков равно 512 МБ, а его делитель 221 преобразует единицы измерения в ГБ - мы могли бы использовать du -kx с $1 > 512*1024 и s/1024^2  для лучшей человекочитаемости). Внутри условия awk мы устанавливаем s в размер, чтобы можно было удалить его из строки ($0). При этом сохраняется разделитель (который сворачивается в один пробел), поэтому конечный %s представляет собой пробел, а затем имя объединенного каталога. %7s округляет размер %.2f GB (увеличивает до %8s, если у вас >10TB).

В отличие от большинства приведенных здесь решений, это правильно поддерживает каталоги с пробелами в именах (хотя все решения, включая это, будут неправильно обрабатывать имена каталогов, содержащие переносы строк).

 

Ответ 23

По крайней мере, с помощью обычных инструментов это будет трудно сделать из-за формата человекочитаемых чисел (обратите внимание, что sort все делает правильно, поскольку сортирует числа - 508, 64, 61, 2, 2 - он просто не может сортировать числа с плавающей запятой с дополнительным множителем).

Я бы попробовал сделать все наоборот - использовать вывод "du | sort -n -r", а затем преобразовать числа в человекочитаемый формат с помощью какого-нибудь скрипта или программы. 

 

Ответ 24

Вы можете попробовать следующее:

for i in "du -s * | sort -n | cut -f2"

do

  du -h $i;

done 

Схожие статьи

Linux

Какой правильный способ интерпретации системной нагрузки на 4-ядерный 8-поточный процессор

Linux

Как принудительно направить локальный IP-трафик на внешний интерфейс

Linux

Как записать stderr в файл при использовании «tee» с пайпом

Linux

Почему аутентификация по паролю SSH представляет угрозу безопасности?

×