0000: 2f 2a 20 75 6e 69 71 20 2d 2d 20 72 65 6d 6f 76 /* uniq -- remov
0010: 65 20 64 75 70 6c 69 63 61 74 65 20 6c 69 6e 65 e duplicate line
0020: 73 20 66 72 6f 6d 20 61 20 73 6f 72 74 65 64 20 s from a sorted
0030: 66 69 6c 65 0a 20 20 20 43 6f 70 79 72 69 67 68 file. Copyrigh
0040: 74 20 28 43 29 20 38 36 2c 20 39 31 2c 20 31 39 t (C) 86, 91, 19
0050: 39 35 2d 31 39 39 38 2c 20 31 39 39 39 20 46 72 95-1998, 1999 Fr
0060: 65 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e ee Software Foun
0070: 64 61 74 69 6f 6e 2c 20 49 6e 63 2e 0a 0a 20 20 dation, Inc...
0080: 20 54 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 This program is
0090: 20 66 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 free software;
00a0: 79 6f 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 you can redistri
00b0: 62 75 74 65 20 69 74 20 61 6e 64 2f 6f 72 20 6d bute it and/or m
00c0: 6f 64 69 66 79 0a 20 20 20 69 74 20 75 6e 64 65 odify. it unde
00d0: 72 20 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 r the terms of t
00e0: 68 65 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 he GNU General P
00f0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 61 73 ublic License as
0100: 20 70 75 62 6c 69 73 68 65 64 20 62 79 0a 20 20 published by.
0110: 20 74 68 65 20 46 72 65 65 20 53 6f 66 74 77 61 the Free Softwa
0120: 72 65 20 46 6f 75 6e 64 61 74 69 6f 6e 3b 20 65 re Foundation; e
0130: 69 74 68 65 72 20 76 65 72 73 69 6f 6e 20 32 2c ither version 2,
0140: 20 6f 72 20 28 61 74 20 79 6f 75 72 20 6f 70 74 or (at your opt
0150: 69 6f 6e 29 0a 20 20 20 61 6e 79 20 6c 61 74 65 ion). any late
0160: 72 20 76 65 72 73 69 6f 6e 2e 0a 0a 20 20 20 54 r version... T
0170: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 his program is d
0180: 69 73 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 istributed in th
0190: 65 20 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 e hope that it w
01a0: 69 6c 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 20 ill be useful,.
01b0: 20 20 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e but WITHOUT AN
01c0: 59 20 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 Y WARRANTY; with
01d0: 6f 75 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 out even the imp
01e0: 6c 69 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 lied warranty of
01f0: 0a 20 20 20 4d 45 52 43 48 41 4e 54 41 42 49 4c . MERCHANTABIL
0200: 49 54 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 ITY or FITNESS F
0210: 4f 52 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 OR A PARTICULAR
0220: 50 55 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 PURPOSE. See th
0230: 65 0a 20 20 20 47 4e 55 20 47 65 6e 65 72 61 6c e. GNU General
0240: 20 50 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 Public License
0250: 66 6f 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 for more details
0260: 2e 0a 0a 20 20 20 59 6f 75 20 73 68 6f 75 6c 64 ... You should
0270: 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 61 have received a
0280: 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e 55 copy of the GNU
0290: 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 20 General Public
02a0: 4c 69 63 65 6e 73 65 0a 20 20 20 61 6c 6f 6e 67 License. along
02b0: 20 77 69 74 68 20 74 68 69 73 20 70 72 6f 67 72 with this progr
02c0: 61 6d 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 74 am; if not, writ
02d0: 65 20 74 6f 20 74 68 65 20 46 72 65 65 20 53 6f e to the Free So
02e0: 66 74 77 61 72 65 20 46 6f 75 6e 64 61 74 69 6f ftware Foundatio
02f0: 6e 2c 0a 20 20 20 49 6e 63 2e 2c 20 35 31 20 46 n,. Inc., 51 F
0300: 72 61 6e 6b 6c 69 6e 20 53 74 72 65 65 74 2c 20 ranklin Street,
0310: 46 69 66 74 68 20 46 6c 6f 6f 72 2c 20 42 6f 73 Fifth Floor, Bos
0320: 74 6f 6e 2c 20 4d 41 20 30 32 31 31 30 2d 31 33 ton, MA 02110-13
0330: 30 31 2c 20 55 53 41 2e 20 20 2a 2f 0a 0a 2f 2a 01, USA. */../*
0340: 20 57 72 69 74 74 65 6e 20 62 79 20 52 69 63 68 Written by Rich
0350: 61 72 64 20 53 74 61 6c 6c 6d 61 6e 20 61 6e 64 ard Stallman and
0360: 20 44 61 76 69 64 20 4d 61 63 4b 65 6e 7a 69 65 David MacKenzie
0370: 2e 20 2a 2f 0a 2f 2a 20 32 30 30 30 2d 30 33 2d . */./* 2000-03-
0380: 32 32 20 20 54 72 69 6d 6d 65 64 20 64 6f 77 6e 22 Trimmed down
0390: 20 74 6f 20 74 68 65 20 63 61 73 65 20 6f 66 20 to the case of
03a0: 22 75 6e 69 71 20 2d 75 22 20 62 79 20 42 72 75 "uniq -u" by Bru
03b0: 6e 6f 20 48 61 69 62 6c 65 2e 20 2a 2f 0a 0a 23 no Haible. */..#
03c0: 69 6e 63 6c 75 64 65 20 3c 73 74 64 64 65 66 2e include <stddef.
03d0: 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 74 64 h>.#include <std
03e0: 69 6f 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c io.h>.#include <
03f0: 73 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 stdlib.h>.#inclu
0400: 64 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f de <string.h>../
0410: 2a 20 54 68 65 20 6e 61 6d 65 20 74 68 69 73 20 * The name this
0420: 70 72 6f 67 72 61 6d 20 77 61 73 20 72 75 6e 20 program was run
0430: 77 69 74 68 2e 20 2a 2f 0a 73 74 61 74 69 63 20 with. */.static
0440: 63 68 61 72 20 2a 70 72 6f 67 72 61 6d 5f 6e 61 char *program_na
0450: 6d 65 3b 0a 0a 73 74 61 74 69 63 20 76 6f 69 64 me;..static void
0460: 0a 78 61 6c 6c 6f 63 5f 66 61 69 6c 20 28 76 6f .xalloc_fail (vo
0470: 69 64 29 0a 7b 0a 20 20 66 70 72 69 6e 74 66 20 id).{. fprintf
0480: 28 73 74 64 65 72 72 2c 20 22 25 73 3a 20 76 69 (stderr, "%s: vi
0490: 72 74 75 61 6c 20 6d 65 6d 6f 72 79 20 65 78 68 rtual memory exh
04a0: 61 75 73 74 65 64 5c 6e 22 2c 20 70 72 6f 67 72 austed\n", progr
04b0: 61 6d 5f 6e 61 6d 65 29 3b 0a 20 20 65 78 69 74 am_name);. exit
04c0: 20 28 31 29 3b 0a 7d 0a 0a 2f 2a 20 41 6c 6c 6f (1);.}../* Allo
04d0: 63 61 74 65 20 4e 20 62 79 74 65 73 20 6f 66 20 cate N bytes of
04e0: 6d 65 6d 6f 72 79 20 64 79 6e 61 6d 69 63 61 6c memory dynamical
04f0: 6c 79 2c 20 77 69 74 68 20 65 72 72 6f 72 20 63 ly, with error c
0500: 68 65 63 6b 69 6e 67 2e 20 20 2a 2f 0a 0a 76 6f hecking. */..vo
0510: 69 64 20 2a 0a 78 6d 61 6c 6c 6f 63 20 28 73 69 id *.xmalloc (si
0520: 7a 65 5f 74 20 6e 29 0a 7b 0a 20 20 76 6f 69 64 ze_t n).{. void
0530: 20 2a 70 3b 0a 0a 20 20 70 20 3d 20 6d 61 6c 6c *p;.. p = mall
0540: 6f 63 20 28 6e 29 3b 0a 20 20 69 66 20 28 70 20 oc (n);. if (p
0550: 3d 3d 20 30 29 0a 20 20 20 20 78 61 6c 6c 6f 63 == 0). xalloc
0560: 5f 66 61 69 6c 20 28 29 3b 0a 20 20 72 65 74 75 _fail ();. retu
0570: 72 6e 20 70 3b 0a 7d 0a 0a 2f 2a 20 43 68 61 6e rn p;.}../* Chan
0580: 67 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 61 ge the size of a
0590: 6e 20 61 6c 6c 6f 63 61 74 65 64 20 62 6c 6f 63 n allocated bloc
05a0: 6b 20 6f 66 20 6d 65 6d 6f 72 79 20 50 20 74 6f k of memory P to
05b0: 20 4e 20 62 79 74 65 73 2c 0a 20 20 20 77 69 74 N bytes,. wit
05c0: 68 20 65 72 72 6f 72 20 63 68 65 63 6b 69 6e 67 h error checking
05d0: 2e 0a 20 20 20 49 66 20 50 20 69 73 20 4e 55 4c .. If P is NUL
05e0: 4c 2c 20 72 75 6e 20 78 6d 61 6c 6c 6f 63 2e 20 L, run xmalloc.
05f0: 20 2a 2f 0a 0a 76 6f 69 64 20 2a 0a 78 72 65 61 */..void *.xrea
0600: 6c 6c 6f 63 20 28 76 6f 69 64 20 2a 70 2c 20 73 lloc (void *p, s
0610: 69 7a 65 5f 74 20 6e 29 0a 7b 0a 20 20 70 20 3d ize_t n).{. p =
0620: 20 72 65 61 6c 6c 6f 63 20 28 70 2c 20 6e 29 3b realloc (p, n);
0630: 0a 20 20 69 66 20 28 70 20 3d 3d 20 30 29 0a 20 . if (p == 0).
0640: 20 20 20 78 61 6c 6c 6f 63 5f 66 61 69 6c 20 28 xalloc_fail (
0650: 29 3b 0a 20 20 72 65 74 75 72 6e 20 70 3b 0a 7d );. return p;.}
0660: 0a 0a 2f 2a 20 41 20 60 73 74 72 75 63 74 20 6c ../* A `struct l
0670: 69 6e 65 62 75 66 66 65 72 27 20 68 6f 6c 64 73 inebuffer' holds
0680: 20 61 20 6c 69 6e 65 20 6f 66 20 74 65 78 74 2e a line of text.
0690: 20 2a 2f 0a 0a 73 74 72 75 63 74 20 6c 69 6e 65 */..struct line
06a0: 62 75 66 66 65 72 0a 7b 0a 20 20 73 69 7a 65 5f buffer.{. size_
06b0: 74 20 73 69 7a 65 3b 09 09 09 2f 2a 20 41 6c 6c t size;.../* All
06c0: 6f 63 61 74 65 64 2e 20 2a 2f 0a 20 20 73 69 7a ocated. */. siz
06d0: 65 5f 74 20 6c 65 6e 67 74 68 3b 09 09 2f 2a 20 e_t length;../*
06e0: 55 73 65 64 2e 20 2a 2f 0a 20 20 63 68 61 72 20 Used. */. char
06f0: 2a 62 75 66 66 65 72 3b 0a 7d 3b 0a 0a 2f 2a 20 *buffer;.};../*
0700: 49 6e 69 74 69 61 6c 69 7a 65 20 6c 69 6e 65 62 Initialize lineb
0710: 75 66 66 65 72 20 4c 49 4e 45 42 55 46 46 45 52 uffer LINEBUFFER
0720: 20 66 6f 72 20 75 73 65 2e 20 2a 2f 0a 0a 73 74 for use. */..st
0730: 61 74 69 63 20 76 6f 69 64 0a 69 6e 69 74 62 75 atic void.initbu
0740: 66 66 65 72 20 28 73 74 72 75 63 74 20 6c 69 6e ffer (struct lin
0750: 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 62 75 66 ebuffer *linebuf
0760: 66 65 72 29 0a 7b 0a 20 20 6c 69 6e 65 62 75 66 fer).{. linebuf
0770: 66 65 72 2d 3e 6c 65 6e 67 74 68 20 3d 20 30 3b fer->length = 0;
0780: 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 . linebuffer->s
0790: 69 7a 65 20 3d 20 32 30 30 3b 0a 20 20 6c 69 6e ize = 200;. lin
07a0: 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20 ebuffer->buffer
07b0: 3d 20 28 63 68 61 72 20 2a 29 20 78 6d 61 6c 6c = (char *) xmall
07c0: 6f 63 20 28 6c 69 6e 65 62 75 66 66 65 72 2d 3e oc (linebuffer->
07d0: 73 69 7a 65 29 3b 0a 7d 0a 0a 2f 2a 20 52 65 61 size);.}../* Rea
07e0: 64 20 61 6e 20 61 72 62 69 74 72 61 72 69 6c 79 d an arbitrarily
07f0: 20 6c 6f 6e 67 20 6c 69 6e 65 20 6f 66 20 74 65 long line of te
0800: 78 74 20 66 72 6f 6d 20 53 54 52 45 41 4d 20 69 xt from STREAM i
0810: 6e 74 6f 20 4c 49 4e 45 42 55 46 46 45 52 2e 0a nto LINEBUFFER..
0820: 20 20 20 4b 65 65 70 20 74 68 65 20 6e 65 77 6c Keep the newl
0830: 69 6e 65 3b 20 61 70 70 65 6e 64 20 61 20 6e 65 ine; append a ne
0840: 77 6c 69 6e 65 20 69 66 20 69 74 27 73 20 74 68 wline if it's th
0850: 65 20 6c 61 73 74 20 6c 69 6e 65 20 6f 66 20 61 e last line of a
0860: 20 66 69 6c 65 0a 20 20 20 74 68 61 74 20 65 6e file. that en
0870: 64 73 20 69 6e 20 61 20 6e 6f 6e 2d 6e 65 77 6c ds in a non-newl
0880: 69 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20 ine character.
0890: 44 6f 20 6e 6f 74 20 6e 75 6c 6c 20 74 65 72 6d Do not null term
08a0: 69 6e 61 74 65 2e 0a 20 20 20 52 65 74 75 72 6e inate.. Return
08b0: 20 4c 49 4e 45 42 55 46 46 45 52 2c 20 65 78 63 LINEBUFFER, exc
08c0: 65 70 74 20 61 74 20 65 6e 64 20 6f 66 20 66 69 ept at end of fi
08d0: 6c 65 20 72 65 74 75 72 6e 20 30 2e 20 20 2a 2f le return 0. */
08e0: 0a 0a 73 74 61 74 69 63 20 73 74 72 75 63 74 20 ..static struct
08f0: 6c 69 6e 65 62 75 66 66 65 72 20 2a 0a 72 65 61 linebuffer *.rea
0900: 64 6c 69 6e 65 20 28 73 74 72 75 63 74 20 6c 69 dline (struct li
0910: 6e 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 62 75 nebuffer *linebu
0920: 66 66 65 72 2c 20 46 49 4c 45 20 2a 73 74 72 65 ffer, FILE *stre
0930: 61 6d 29 0a 7b 0a 20 20 69 6e 74 20 63 3b 0a 20 am).{. int c;.
0940: 20 63 68 61 72 20 2a 62 75 66 66 65 72 20 3d 20 char *buffer =
0950: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 linebuffer->buff
0960: 65 72 3b 0a 20 20 63 68 61 72 20 2a 70 20 3d 20 er;. char *p =
0970: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 linebuffer->buff
0980: 65 72 3b 0a 20 20 63 68 61 72 20 2a 65 6e 64 20 er;. char *end
0990: 3d 20 62 75 66 66 65 72 20 2b 20 6c 69 6e 65 62 = buffer + lineb
09a0: 75 66 66 65 72 2d 3e 73 69 7a 65 20 2d 20 31 3b uffer->size - 1;
09b0: 20 2f 2a 20 53 65 6e 74 69 6e 65 6c 2e 20 2a 2f /* Sentinel. */
09c0: 0a 0a 20 20 69 66 20 28 66 65 6f 66 20 28 73 74 .. if (feof (st
09d0: 72 65 61 6d 29 20 7c 7c 20 66 65 72 72 6f 72 20 ream) || ferror
09e0: 28 73 74 72 65 61 6d 29 29 0a 20 20 20 20 72 65 (stream)). re
09f0: 74 75 72 6e 20 30 3b 0a 0a 20 20 64 6f 0a 20 20 turn 0;.. do.
0a00: 20 20 7b 0a 20 20 20 20 20 20 63 20 3d 20 67 65 {. c = ge
0a10: 74 63 20 28 73 74 72 65 61 6d 29 3b 0a 20 20 20 tc (stream);.
0a20: 20 20 20 69 66 20 28 63 20 3d 3d 20 45 4f 46 29 if (c == EOF)
0a30: 0a 09 7b 0a 09 20 20 69 66 20 28 70 20 3d 3d 20 ..{.. if (p ==
0a40: 62 75 66 66 65 72 29 0a 09 20 20 20 20 72 65 74 buffer).. ret
0a50: 75 72 6e 20 30 3b 0a 09 20 20 69 66 20 28 70 5b urn 0;.. if (p[
0a60: 2d 31 5d 20 3d 3d 20 27 5c 6e 27 29 0a 09 20 20 -1] == '\n')..
0a70: 20 20 62 72 65 61 6b 3b 0a 09 20 20 63 20 3d 20 break;.. c =
0a80: 27 5c 6e 27 3b 0a 09 7d 0a 20 20 20 20 20 20 69 '\n';..}. i
0a90: 66 20 28 70 20 3d 3d 20 65 6e 64 29 0a 09 7b 0a f (p == end)..{.
0aa0: 09 20 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 . linebuffer->s
0ab0: 69 7a 65 20 2a 3d 20 32 3b 0a 09 20 20 62 75 66 ize *= 2;.. buf
0ac0: 66 65 72 20 3d 20 28 63 68 61 72 20 2a 29 20 78 fer = (char *) x
0ad0: 72 65 61 6c 6c 6f 63 20 28 62 75 66 66 65 72 2c realloc (buffer,
0ae0: 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a linebuffer->siz
0af0: 65 29 3b 0a 09 20 20 70 20 3d 20 70 20 2d 20 6c e);.. p = p - l
0b00: 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65 inebuffer->buffe
0b10: 72 20 2b 20 62 75 66 66 65 72 3b 0a 09 20 20 6c r + buffer;.. l
0b20: 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65 inebuffer->buffe
0b30: 72 20 3d 20 62 75 66 66 65 72 3b 0a 09 20 20 65 r = buffer;.. e
0b40: 6e 64 20 3d 20 62 75 66 66 65 72 20 2b 20 6c 69 nd = buffer + li
0b50: 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20 2d nebuffer->size -
0b60: 20 31 3b 0a 09 7d 0a 20 20 20 20 20 20 2a 70 2b 1;..}. *p+
0b70: 2b 20 3d 20 63 3b 0a 20 20 20 20 7d 0a 20 20 77 + = c;. }. w
0b80: 68 69 6c 65 20 28 63 20 21 3d 20 27 5c 6e 27 29 hile (c != '\n')
0b90: 3b 0a 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d ;.. linebuffer-
0ba0: 3e 6c 65 6e 67 74 68 20 3d 20 70 20 2d 20 62 75 >length = p - bu
0bb0: 66 66 65 72 3b 0a 20 20 72 65 74 75 72 6e 20 6c ffer;. return l
0bc0: 69 6e 65 62 75 66 66 65 72 3b 0a 7d 0a 0a 2f 2a inebuffer;.}../*
0bd0: 20 46 72 65 65 20 6c 69 6e 65 62 75 66 66 65 72 Free linebuffer
0be0: 20 4c 49 4e 45 42 55 46 46 45 52 27 73 20 64 61 LINEBUFFER's da
0bf0: 74 61 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76 ta. */..static v
0c00: 6f 69 64 0a 66 72 65 65 62 75 66 66 65 72 20 28 oid.freebuffer (
0c10: 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66 66 65 struct linebuffe
0c20: 72 20 2a 6c 69 6e 65 62 75 66 66 65 72 29 0a 7b r *linebuffer).{
0c30: 0a 20 20 66 72 65 65 20 28 6c 69 6e 65 62 75 66 . free (linebuf
0c40: 66 65 72 2d 3e 62 75 66 66 65 72 29 3b 0a 7d 0a fer->buffer);.}.
0c50: 0a 2f 2a 20 55 6e 64 65 66 69 6e 65 2c 20 74 6f ./* Undefine, to
0c60: 20 61 76 6f 69 64 20 77 61 72 6e 69 6e 67 20 61 avoid warning a
0c70: 62 6f 75 74 20 72 65 64 65 66 69 6e 69 74 69 6f bout redefinitio
0c80: 6e 20 6f 6e 20 73 6f 6d 65 20 73 79 73 74 65 6d n on some system
0c90: 73 2e 20 20 2a 2f 0a 23 75 6e 64 65 66 20 6d 69 s. */.#undef mi
0ca0: 6e 0a 23 64 65 66 69 6e 65 20 6d 69 6e 28 78 2c n.#define min(x,
0cb0: 20 79 29 20 28 28 78 29 20 3c 20 28 79 29 20 3f y) ((x) < (y) ?
0cc0: 20 28 78 29 20 3a 20 28 79 29 29 0a 0a 2f 2a 20 (x) : (y))../*
0cd0: 52 65 74 75 72 6e 20 7a 65 72 6f 20 69 66 20 74 Return zero if t
0ce0: 77 6f 20 73 74 72 69 6e 67 73 20 4f 4c 44 20 61 wo strings OLD a
0cf0: 6e 64 20 4e 45 57 20 6d 61 74 63 68 2c 20 6e 6f nd NEW match, no
0d00: 6e 7a 65 72 6f 20 69 66 20 6e 6f 74 2e 0a 20 20 nzero if not..
0d10: 20 4f 4c 44 20 61 6e 64 20 4e 45 57 20 70 6f 69 OLD and NEW poi
0d20: 6e 74 20 6e 6f 74 20 74 6f 20 74 68 65 20 62 65 nt not to the be
0d30: 67 69 6e 6e 69 6e 67 73 20 6f 66 20 74 68 65 20 ginnings of the
0d40: 6c 69 6e 65 73 0a 20 20 20 62 75 74 20 72 61 74 lines. but rat
0d50: 68 65 72 20 74 6f 20 74 68 65 20 62 65 67 69 6e her to the begin
0d60: 6e 69 6e 67 73 20 6f 66 20 74 68 65 20 66 69 65 nings of the fie
0d70: 6c 64 73 20 74 6f 20 63 6f 6d 70 61 72 65 2e 0a lds to compare..
0d80: 20 20 20 4f 4c 44 4c 45 4e 20 61 6e 64 20 4e 45 OLDLEN and NE
0d90: 57 4c 45 4e 20 61 72 65 20 74 68 65 69 72 20 6c WLEN are their l
0da0: 65 6e 67 74 68 73 2e 20 2a 2f 0a 0a 73 74 61 74 engths. */..stat
0db0: 69 63 20 69 6e 74 0a 64 69 66 66 65 72 65 6e 74 ic int.different
0dc0: 20 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f 6c (const char *ol
0dd0: 64 2c 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6e d, const char *n
0de0: 65 77 2c 20 73 69 7a 65 5f 74 20 6f 6c 64 6c 65 ew, size_t oldle
0df0: 6e 2c 20 73 69 7a 65 5f 74 20 6e 65 77 6c 65 6e n, size_t newlen
0e00: 29 0a 7b 0a 20 20 69 6e 74 20 6f 72 64 65 72 3b ).{. int order;
0e10: 0a 0a 20 20 6f 72 64 65 72 20 3d 20 6d 65 6d 63 .. order = memc
0e20: 6d 70 20 28 6f 6c 64 2c 20 6e 65 77 2c 20 6d 69 mp (old, new, mi
0e30: 6e 20 28 6f 6c 64 6c 65 6e 2c 20 6e 65 77 6c 65 n (oldlen, newle
0e40: 6e 29 29 3b 0a 0a 20 20 69 66 20 28 6f 72 64 65 n));.. if (orde
0e50: 72 20 3d 3d 20 30 29 0a 20 20 20 20 72 65 74 75 r == 0). retu
0e60: 72 6e 20 6f 6c 64 6c 65 6e 20 2d 20 6e 65 77 6c rn oldlen - newl
0e70: 65 6e 3b 0a 20 20 72 65 74 75 72 6e 20 6f 72 64 en;. return ord
0e80: 65 72 3b 0a 7d 0a 0a 2f 2a 20 4f 75 74 70 75 74 er;.}../* Output
0e90: 20 74 68 65 20 6c 69 6e 65 20 69 6e 20 6c 69 6e the line in lin
0ea0: 65 62 75 66 66 65 72 20 4c 49 4e 45 20 74 6f 20 ebuffer LINE to
0eb0: 73 74 72 65 61 6d 20 53 54 52 45 41 4d 0a 20 20 stream STREAM.
0ec0: 20 70 72 6f 76 69 64 65 64 20 74 68 61 74 20 74 provided that t
0ed0: 68 65 20 73 77 69 74 63 68 65 73 20 73 61 79 20 he switches say
0ee0: 69 74 20 73 68 6f 75 6c 64 20 62 65 20 6f 75 74 it should be out
0ef0: 70 75 74 2e 0a 20 20 20 49 66 20 72 65 71 75 65 put.. If reque
0f00: 73 74 65 64 2c 20 70 72 69 6e 74 20 74 68 65 20 sted, print the
0f10: 6e 75 6d 62 65 72 20 6f 66 20 74 69 6d 65 73 20 number of times
0f20: 69 74 20 6f 63 63 75 72 72 65 64 2c 20 61 73 20 it occurred, as
0f30: 77 65 6c 6c 3b 0a 20 20 20 4c 49 4e 45 43 4f 55 well;. LINECOU
0f40: 4e 54 20 2b 20 31 20 69 73 20 74 68 65 20 6e 75 NT + 1 is the nu
0f50: 6d 62 65 72 20 6f 66 20 74 69 6d 65 73 20 74 68 mber of times th
0f60: 61 74 20 74 68 65 20 6c 69 6e 65 20 6f 63 63 75 at the line occu
0f70: 72 72 65 64 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 rred. */..static
0f80: 20 76 6f 69 64 0a 77 72 69 74 65 6c 69 6e 65 20 void.writeline
0f90: 28 63 6f 6e 73 74 20 73 74 72 75 63 74 20 6c 69 (const struct li
0fa0: 6e 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 2c 20 nebuffer *line,
0fb0: 46 49 4c 45 20 2a 73 74 72 65 61 6d 2c 20 69 6e FILE *stream, in
0fc0: 74 20 6c 69 6e 65 63 6f 75 6e 74 29 0a 7b 0a 20 t linecount).{.
0fd0: 20 69 66 20 28 6c 69 6e 65 63 6f 75 6e 74 20 3d if (linecount =
0fe0: 3d 20 30 29 0a 20 20 20 20 66 77 72 69 74 65 20 = 0). fwrite
0ff0: 28 6c 69 6e 65 2d 3e 62 75 66 66 65 72 2c 20 31 (line->buffer, 1
1000: 2c 20 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68 2c 20 , line->length,
1010: 73 74 72 65 61 6d 29 3b 0a 7d 0a 0a 2f 2a 20 50 stream);.}../* P
1020: 72 6f 63 65 73 73 20 69 6e 70 75 74 20 66 69 6c rocess input fil
1030: 65 20 49 4e 46 49 4c 45 20 77 69 74 68 20 6f 75 e INFILE with ou
1040: 74 70 75 74 20 74 6f 20 4f 55 54 46 49 4c 45 2e tput to OUTFILE.
1050: 0a 20 20 20 49 66 20 65 69 74 68 65 72 20 69 73 . If either is
1060: 20 22 2d 22 2c 20 75 73 65 20 74 68 65 20 73 74 "-", use the st
1070: 61 6e 64 61 72 64 20 49 2f 4f 20 73 74 72 65 61 andard I/O strea
1080: 6d 20 66 6f 72 20 69 74 20 69 6e 73 74 65 61 64 m for it instead
1090: 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69 . */..static voi
10a0: 64 0a 63 68 65 63 6b 5f 66 69 6c 65 20 28 63 6f d.check_file (co
10b0: 6e 73 74 20 63 68 61 72 20 2a 69 6e 66 69 6c 65 nst char *infile
10c0: 2c 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f 75 , const char *ou
10d0: 74 66 69 6c 65 29 0a 7b 0a 20 20 46 49 4c 45 20 tfile).{. FILE
10e0: 2a 69 73 74 72 65 61 6d 3b 0a 20 20 46 49 4c 45 *istream;. FILE
10f0: 20 2a 6f 73 74 72 65 61 6d 3b 0a 20 20 73 74 72 *ostream;. str
1100: 75 63 74 20 6c 69 6e 65 62 75 66 66 65 72 20 6c uct linebuffer l
1110: 62 31 2c 20 6c 62 32 3b 0a 20 20 73 74 72 75 63 b1, lb2;. struc
1120: 74 20 6c 69 6e 65 62 75 66 66 65 72 20 2a 74 68 t linebuffer *th
1130: 69 73 6c 69 6e 65 2c 20 2a 70 72 65 76 6c 69 6e isline, *prevlin
1140: 65 2c 20 2a 65 78 63 68 3b 0a 20 20 63 68 61 72 e, *exch;. char
1150: 20 2a 70 72 65 76 66 69 65 6c 64 2c 20 2a 74 68 *prevfield, *th
1160: 69 73 66 69 65 6c 64 3b 0a 20 20 73 69 7a 65 5f isfield;. size_
1170: 74 20 70 72 65 76 6c 65 6e 2c 20 74 68 69 73 6c t prevlen, thisl
1180: 65 6e 3b 0a 20 20 69 6e 74 20 6d 61 74 63 68 5f en;. int match_
1190: 63 6f 75 6e 74 20 3d 20 30 3b 0a 0a 20 20 69 66 count = 0;.. if
11a0: 20 28 21 73 74 72 63 6d 70 20 28 69 6e 66 69 6c (!strcmp (infil
11b0: 65 2c 20 22 2d 22 29 29 0a 20 20 20 20 69 73 74 e, "-")). ist
11c0: 72 65 61 6d 20 3d 20 73 74 64 69 6e 3b 0a 20 20 ream = stdin;.
11d0: 65 6c 73 65 0a 20 20 20 20 69 73 74 72 65 61 6d else. istream
11e0: 20 3d 20 66 6f 70 65 6e 20 28 69 6e 66 69 6c 65 = fopen (infile
11f0: 2c 20 22 72 22 29 3b 0a 20 20 69 66 20 28 69 73 , "r");. if (is
1200: 74 72 65 61 6d 20 3d 3d 20 4e 55 4c 4c 29 0a 20 tream == NULL).
1210: 20 20 20 7b 0a 20 20 20 20 20 20 66 70 72 69 6e {. fprin
1220: 74 66 20 28 73 74 64 65 72 72 2c 20 22 25 73 3a tf (stderr, "%s:
1230: 20 65 72 72 6f 72 20 6f 70 65 6e 69 6e 67 20 25 error opening %
1240: 73 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 s\n", program_na
1250: 6d 65 2c 20 69 6e 66 69 6c 65 29 3b 0a 20 20 20 me, infile);.
1260: 20 20 20 65 78 69 74 20 28 31 29 3b 0a 20 20 20 exit (1);.
1270: 20 7d 0a 0a 20 20 69 66 20 28 21 73 74 72 63 6d }.. if (!strcm
1280: 70 20 28 6f 75 74 66 69 6c 65 2c 20 22 2d 22 29 p (outfile, "-")
1290: 29 0a 20 20 20 20 6f 73 74 72 65 61 6d 20 3d 20 ). ostream =
12a0: 73 74 64 6f 75 74 3b 0a 20 20 65 6c 73 65 0a 20 stdout;. else.
12b0: 20 20 20 6f 73 74 72 65 61 6d 20 3d 20 66 6f 70 ostream = fop
12c0: 65 6e 20 28 6f 75 74 66 69 6c 65 2c 20 22 77 22 en (outfile, "w"
12d0: 29 3b 0a 20 20 69 66 20 28 6f 73 74 72 65 61 6d );. if (ostream
12e0: 20 3d 3d 20 4e 55 4c 4c 29 0a 20 20 20 20 7b 0a == NULL). {.
12f0: 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28 73 fprintf (s
1300: 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72 6f tderr, "%s: erro
1310: 72 20 6f 70 65 6e 69 6e 67 20 25 73 5c 6e 22 2c r opening %s\n",
1320: 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 6f program_name, o
1330: 75 74 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65 utfile);. e
1340: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a xit (1);. }..
1350: 20 20 74 68 69 73 6c 69 6e 65 20 3d 20 26 6c 62 thisline = &lb
1360: 31 3b 0a 20 20 70 72 65 76 6c 69 6e 65 20 3d 20 1;. prevline =
1370: 26 6c 62 32 3b 0a 0a 20 20 69 6e 69 74 62 75 66 &lb2;.. initbuf
1380: 66 65 72 20 28 74 68 69 73 6c 69 6e 65 29 3b 0a fer (thisline);.
1390: 20 20 69 6e 69 74 62 75 66 66 65 72 20 28 70 72 initbuffer (pr
13a0: 65 76 6c 69 6e 65 29 3b 0a 0a 20 20 69 66 20 28 evline);.. if (
13b0: 72 65 61 64 6c 69 6e 65 20 28 70 72 65 76 6c 69 readline (prevli
13c0: 6e 65 2c 20 69 73 74 72 65 61 6d 29 20 3d 3d 20 ne, istream) ==
13d0: 30 29 0a 20 20 20 20 67 6f 74 6f 20 63 6c 6f 73 0). goto clos
13e0: 65 66 69 6c 65 73 3b 0a 20 20 70 72 65 76 66 69 efiles;. prevfi
13f0: 65 6c 64 20 3d 20 70 72 65 76 6c 69 6e 65 2d 3e eld = prevline->
1400: 62 75 66 66 65 72 3b 0a 20 20 70 72 65 76 6c 65 buffer;. prevle
1410: 6e 20 3d 20 70 72 65 76 6c 69 6e 65 2d 3e 6c 65 n = prevline->le
1420: 6e 67 74 68 3b 0a 0a 20 20 77 68 69 6c 65 20 28 ngth;.. while (
1430: 21 66 65 6f 66 20 28 69 73 74 72 65 61 6d 29 29 !feof (istream))
1440: 0a 20 20 20 20 7b 0a 20 20 20 20 20 20 69 6e 74 . {. int
1450: 20 6d 61 74 63 68 3b 0a 20 20 20 20 20 20 69 66 match;. if
1460: 20 28 72 65 61 64 6c 69 6e 65 20 28 74 68 69 73 (readline (this
1470: 6c 69 6e 65 2c 20 69 73 74 72 65 61 6d 29 20 3d line, istream) =
1480: 3d 20 30 29 0a 09 62 72 65 61 6b 3b 0a 20 20 20 = 0)..break;.
1490: 20 20 20 74 68 69 73 66 69 65 6c 64 20 3d 20 74 thisfield = t
14a0: 68 69 73 6c 69 6e 65 2d 3e 62 75 66 66 65 72 3b hisline->buffer;
14b0: 0a 20 20 20 20 20 20 74 68 69 73 6c 65 6e 20 3d . thislen =
14c0: 20 74 68 69 73 6c 69 6e 65 2d 3e 6c 65 6e 67 74 thisline->lengt
14d0: 68 3b 0a 20 20 20 20 20 20 6d 61 74 63 68 20 3d h;. match =
14e0: 20 21 64 69 66 66 65 72 65 6e 74 20 28 74 68 69 !different (thi
14f0: 73 66 69 65 6c 64 2c 20 70 72 65 76 66 69 65 6c sfield, prevfiel
1500: 64 2c 20 74 68 69 73 6c 65 6e 2c 20 70 72 65 76 d, thislen, prev
1510: 6c 65 6e 29 3b 0a 0a 20 20 20 20 20 20 69 66 20 len);.. if
1520: 28 6d 61 74 63 68 29 0a 09 2b 2b 6d 61 74 63 68 (match)..++match
1530: 5f 63 6f 75 6e 74 3b 0a 0a 20 20 20 20 20 20 69 _count;.. i
1540: 66 20 28 21 6d 61 74 63 68 29 0a 09 7b 0a 09 20 f (!match)..{..
1550: 20 77 72 69 74 65 6c 69 6e 65 20 28 70 72 65 76 writeline (prev
1560: 6c 69 6e 65 2c 20 6f 73 74 72 65 61 6d 2c 20 6d line, ostream, m
1570: 61 74 63 68 5f 63 6f 75 6e 74 29 3b 0a 09 20 20 atch_count);..
1580: 65 78 63 68 20 3d 20 70 72 65 76 6c 69 6e 65 3b exch = prevline;
1590: 0a 09 20 20 70 72 65 76 6c 69 6e 65 20 3d 20 74 .. prevline = t
15a0: 68 69 73 6c 69 6e 65 3b 0a 09 20 20 74 68 69 73 hisline;.. this
15b0: 6c 69 6e 65 20 3d 20 65 78 63 68 3b 0a 09 20 20 line = exch;..
15c0: 70 72 65 76 66 69 65 6c 64 20 3d 20 74 68 69 73 prevfield = this
15d0: 66 69 65 6c 64 3b 0a 09 20 20 70 72 65 76 6c 65 field;.. prevle
15e0: 6e 20 3d 20 74 68 69 73 6c 65 6e 3b 0a 09 20 20 n = thislen;..
15f0: 69 66 20 28 21 6d 61 74 63 68 29 0a 09 20 20 20 if (!match)..
1600: 20 6d 61 74 63 68 5f 63 6f 75 6e 74 20 3d 20 30 match_count = 0
1610: 3b 0a 09 7d 0a 20 20 20 20 7d 0a 0a 20 20 77 72 ;..}. }.. wr
1620: 69 74 65 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e iteline (prevlin
1630: 65 2c 20 6f 73 74 72 65 61 6d 2c 20 6d 61 74 63 e, ostream, matc
1640: 68 5f 63 6f 75 6e 74 29 3b 0a 0a 20 63 6c 6f 73 h_count);.. clos
1650: 65 66 69 6c 65 73 3a 0a 20 20 69 66 20 28 66 65 efiles:. if (fe
1660: 72 72 6f 72 20 28 69 73 74 72 65 61 6d 29 20 7c rror (istream) |
1670: 7c 20 66 63 6c 6f 73 65 20 28 69 73 74 72 65 61 | fclose (istrea
1680: 6d 29 20 3d 3d 20 45 4f 46 29 0a 20 20 20 20 7b m) == EOF). {
1690: 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28 . fprintf (
16a0: 73 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72 stderr, "%s: err
16b0: 6f 72 20 72 65 61 64 69 6e 67 20 25 73 5c 6e 22 or reading %s\n"
16c0: 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 , program_name,
16d0: 69 6e 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65 infile);. e
16e0: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a xit (1);. }..
16f0: 20 20 69 66 20 28 66 65 72 72 6f 72 20 28 6f 73 if (ferror (os
1700: 74 72 65 61 6d 29 20 7c 7c 20 66 63 6c 6f 73 65 tream) || fclose
1710: 20 28 6f 73 74 72 65 61 6d 29 20 3d 3d 20 45 4f (ostream) == EO
1720: 46 29 0a 20 20 20 20 7b 0a 20 20 20 20 20 20 66 F). {. f
1730: 70 72 69 6e 74 66 20 28 73 74 64 65 72 72 2c 20 printf (stderr,
1740: 22 25 73 3a 20 65 72 72 6f 72 20 77 72 69 74 69 "%s: error writi
1750: 6e 67 20 25 73 5c 6e 22 2c 20 70 72 6f 67 72 61 ng %s\n", progra
1760: 6d 5f 6e 61 6d 65 2c 20 6f 75 74 66 69 6c 65 29 m_name, outfile)
1770: 3b 0a 20 20 20 20 20 20 65 78 69 74 20 28 31 29 ;. exit (1)
1780: 3b 0a 20 20 20 20 7d 0a 0a 20 20 66 72 65 65 62 ;. }.. freeb
1790: 75 66 66 65 72 20 28 26 6c 62 31 29 3b 0a 20 20 uffer (&lb1);.
17a0: 66 72 65 65 62 75 66 66 65 72 20 28 26 6c 62 32 freebuffer (&lb2
17b0: 29 3b 0a 7d 0a 0a 69 6e 74 0a 6d 61 69 6e 20 28 );.}..int.main (
17c0: 69 6e 74 20 61 72 67 63 2c 20 63 68 61 72 20 2a int argc, char *
17d0: 2a 61 72 67 76 29 0a 7b 0a 20 20 63 6f 6e 73 74 *argv).{. const
17e0: 20 63 68 61 72 20 2a 69 6e 66 69 6c 65 20 3d 20 char *infile =
17f0: 22 2d 22 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61 "-";. const cha
1800: 72 20 2a 6f 75 74 66 69 6c 65 20 3d 20 22 2d 22 r *outfile = "-"
1810: 3b 0a 20 20 69 6e 74 20 6f 70 74 69 6e 64 20 3d ;. int optind =
1820: 20 31 3b 0a 0a 20 20 70 72 6f 67 72 61 6d 5f 6e 1;.. program_n
1830: 61 6d 65 20 3d 20 61 72 67 76 5b 30 5d 3b 0a 0a ame = argv[0];..
1840: 20 20 69 66 20 28 6f 70 74 69 6e 64 20 3c 20 61 if (optind < a
1850: 72 67 63 29 0a 20 20 20 20 69 6e 66 69 6c 65 20 rgc). infile
1860: 3d 20 61 72 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d = argv[optind++]
1870: 3b 0a 0a 20 20 69 66 20 28 6f 70 74 69 6e 64 20 ;.. if (optind
1880: 3c 20 61 72 67 63 29 0a 20 20 20 20 6f 75 74 66 < argc). outf
1890: 69 6c 65 20 3d 20 61 72 67 76 5b 6f 70 74 69 6e ile = argv[optin
18a0: 64 2b 2b 5d 3b 0a 0a 20 20 69 66 20 28 6f 70 74 d++];.. if (opt
18b0: 69 6e 64 20 3c 20 61 72 67 63 29 0a 20 20 20 20 ind < argc).
18c0: 7b 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 {. fprintf
18d0: 28 73 74 64 65 72 72 2c 20 22 25 73 3a 20 74 6f (stderr, "%s: to
18e0: 6f 20 6d 61 6e 79 20 61 72 67 75 6d 65 6e 74 73 o many arguments
18f0: 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d \n", program_nam
1900: 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20 28 e);. exit (
1910: 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 63 68 65 1);. }.. che
1920: 63 6b 5f 66 69 6c 65 20 28 69 6e 66 69 6c 65 2c ck_file (infile,
1930: 20 6f 75 74 66 69 6c 65 29 3b 0a 0a 20 20 65 78 outfile);.. ex
1940: 69 74 20 28 30 29 3b 0a 7d 0a it (0);.}.