0000: 2f 2a 20 75 6e 69 71 20 2d 2d 20 72 65 6d 6f 76 /* uniq -- remov
0010: 65 20 64 75 70 6c 69 63 61 74 65 20 6c 69 6e 65 e duplicate line
0020: 73 20 66 72 6f 6d 20 61 20 73 6f 72 74 65 64 20 s from a sorted
0030: 66 69 6c 65 0a 20 20 20 43 6f 70 79 72 69 67 68 file. Copyrigh
0040: 74 20 28 43 29 20 38 36 2c 20 39 31 2c 20 31 39 t (C) 86, 91, 19
0050: 39 35 2d 31 39 39 38 2c 20 31 39 39 39 20 46 72 95-1998, 1999 Fr
0060: 65 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e ee Software Foun
0070: 64 61 74 69 6f 6e 2c 20 49 6e 63 2e 0a 0a 20 20 dation, Inc...
0080: 20 54 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 This program is
0090: 20 66 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20 free software;
00a0: 79 6f 75 20 63 61 6e 20 72 65 64 69 73 74 72 69 you can redistri
00b0: 62 75 74 65 20 69 74 20 61 6e 64 2f 6f 72 20 6d bute it and/or m
00c0: 6f 64 69 66 79 0a 20 20 20 69 74 20 75 6e 64 65 odify. it unde
00d0: 72 20 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74 r the terms of t
00e0: 68 65 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50 he GNU General P
00f0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 61 73 ublic License as
0100: 20 70 75 62 6c 69 73 68 65 64 20 62 79 0a 20 20 published by.
0110: 20 74 68 65 20 46 72 65 65 20 53 6f 66 74 77 61 the Free Softwa
0120: 72 65 20 46 6f 75 6e 64 61 74 69 6f 6e 3b 20 65 re Foundation; e
0130: 69 74 68 65 72 20 76 65 72 73 69 6f 6e 20 32 2c ither version 2,
0140: 20 6f 72 20 28 61 74 20 79 6f 75 72 20 6f 70 74 or (at your opt
0150: 69 6f 6e 29 0a 20 20 20 61 6e 79 20 6c 61 74 65 ion). any late
0160: 72 20 76 65 72 73 69 6f 6e 2e 0a 0a 20 20 20 54 r version... T
0170: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64 his program is d
0180: 69 73 74 72 69 62 75 74 65 64 20 69 6e 20 74 68 istributed in th
0190: 65 20 68 6f 70 65 20 74 68 61 74 20 69 74 20 77 e hope that it w
01a0: 69 6c 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 20 ill be useful,.
01b0: 20 20 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e but WITHOUT AN
01c0: 59 20 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68 Y WARRANTY; with
01d0: 6f 75 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70 out even the imp
01e0: 6c 69 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66 lied warranty of
01f0: 0a 20 20 20 4d 45 52 43 48 41 4e 54 41 42 49 4c . MERCHANTABIL
0200: 49 54 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46 ITY or FITNESS F
0210: 4f 52 20 41 20 50 41 52 54 49 43 55 4c 41 52 20 OR A PARTICULAR
0220: 50 55 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68 PURPOSE. See th
0230: 65 0a 20 20 20 47 4e 55 20 47 65 6e 65 72 61 6c e. GNU General
0240: 20 50 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 Public License
0250: 66 6f 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73 for more details
0260: 2e 0a 0a 20 20 20 59 6f 75 20 73 68 6f 75 6c 64 ... You should
0270: 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 61 have received a
0280: 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e 55 copy of the GNU
0290: 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 20 General Public
02a0: 4c 69 63 65 6e 73 65 0a 20 20 20 61 6c 6f 6e 67 License. along
02b0: 20 77 69 74 68 20 74 68 69 73 20 70 72 6f 67 72 with this progr
02c0: 61 6d 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 74 am; if not, writ
02d0: 65 20 74 6f 20 74 68 65 20 46 72 65 65 20 53 6f e to the Free So
02e0: 66 74 77 61 72 65 20 46 6f 75 6e 64 61 74 69 6f ftware Foundatio
02f0: 6e 2c 0a 20 20 20 49 6e 63 2e 2c 20 35 39 20 54 n,. Inc., 59 T
0300: 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 75 emple Place - Su
0310: 69 74 65 20 33 33 30 2c 20 42 6f 73 74 6f 6e 2c ite 330, Boston,
0320: 20 4d 41 20 30 32 31 31 31 2d 31 33 30 37 2c 20 MA 02111-1307,
0330: 55 53 41 2e 20 20 2a 2f 0a 0a 2f 2a 20 57 72 69 USA. */../* Wri
0340: 74 74 65 6e 20 62 79 20 52 69 63 68 61 72 64 20 tten by Richard
0350: 53 74 61 6c 6c 6d 61 6e 20 61 6e 64 20 44 61 76 Stallman and Dav
0360: 69 64 20 4d 61 63 4b 65 6e 7a 69 65 2e 20 2a 2f id MacKenzie. */
0370: 0a 2f 2a 20 32 30 30 30 2d 30 33 2d 32 32 20 20 ./* 2000-03-22
0380: 54 72 69 6d 6d 65 64 20 64 6f 77 6e 20 74 6f 20 Trimmed down to
0390: 74 68 65 20 63 61 73 65 20 6f 66 20 22 75 6e 69 the case of "uni
03a0: 71 20 2d 75 22 20 62 79 20 42 72 75 6e 6f 20 48 q -u" by Bruno H
03b0: 61 69 62 6c 65 2e 20 2a 2f 0a 0a 23 69 6e 63 6c aible. */..#incl
03c0: 75 64 65 20 3c 73 74 64 64 65 66 2e 68 3e 0a 23 ude <stddef.h>.#
03d0: 69 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68 include <stdio.h
03e0: 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 74 64 6c >.#include <stdl
03f0: 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c ib.h>.#include <
0400: 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a 20 54 68 string.h>../* Th
0410: 65 20 6e 61 6d 65 20 74 68 69 73 20 70 72 6f 67 e name this prog
0420: 72 61 6d 20 77 61 73 20 72 75 6e 20 77 69 74 68 ram was run with
0430: 2e 20 2a 2f 0a 73 74 61 74 69 63 20 63 68 61 72 . */.static char
0440: 20 2a 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 3b 0a *program_name;.
0450: 0a 73 74 61 74 69 63 20 76 6f 69 64 0a 78 61 6c .static void.xal
0460: 6c 6f 63 5f 66 61 69 6c 20 28 76 6f 69 64 29 0a loc_fail (void).
0470: 7b 0a 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 {. fprintf (std
0480: 65 72 72 2c 20 22 25 73 3a 20 76 69 72 74 75 61 err, "%s: virtua
0490: 6c 20 6d 65 6d 6f 72 79 20 65 78 68 61 75 73 74 l memory exhaust
04a0: 65 64 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e ed\n", program_n
04b0: 61 6d 65 29 3b 0a 20 20 65 78 69 74 20 28 31 29 ame);. exit (1)
04c0: 3b 0a 7d 0a 0a 2f 2a 20 41 6c 6c 6f 63 61 74 65 ;.}../* Allocate
04d0: 20 4e 20 62 79 74 65 73 20 6f 66 20 6d 65 6d 6f N bytes of memo
04e0: 72 79 20 64 79 6e 61 6d 69 63 61 6c 6c 79 2c 20 ry dynamically,
04f0: 77 69 74 68 20 65 72 72 6f 72 20 63 68 65 63 6b with error check
0500: 69 6e 67 2e 20 20 2a 2f 0a 0a 76 6f 69 64 20 2a ing. */..void *
0510: 0a 78 6d 61 6c 6c 6f 63 20 28 73 69 7a 65 5f 74 .xmalloc (size_t
0520: 20 6e 29 0a 7b 0a 20 20 76 6f 69 64 20 2a 70 3b n).{. void *p;
0530: 0a 0a 20 20 70 20 3d 20 6d 61 6c 6c 6f 63 20 28 .. p = malloc (
0540: 6e 29 3b 0a 20 20 69 66 20 28 70 20 3d 3d 20 30 n);. if (p == 0
0550: 29 0a 20 20 20 20 78 61 6c 6c 6f 63 5f 66 61 69 ). xalloc_fai
0560: 6c 20 28 29 3b 0a 20 20 72 65 74 75 72 6e 20 70 l ();. return p
0570: 3b 0a 7d 0a 0a 2f 2a 20 43 68 61 6e 67 65 20 74 ;.}../* Change t
0580: 68 65 20 73 69 7a 65 20 6f 66 20 61 6e 20 61 6c he size of an al
0590: 6c 6f 63 61 74 65 64 20 62 6c 6f 63 6b 20 6f 66 located block of
05a0: 20 6d 65 6d 6f 72 79 20 50 20 74 6f 20 4e 20 62 memory P to N b
05b0: 79 74 65 73 2c 0a 20 20 20 77 69 74 68 20 65 72 ytes,. with er
05c0: 72 6f 72 20 63 68 65 63 6b 69 6e 67 2e 0a 20 20 ror checking..
05d0: 20 49 66 20 50 20 69 73 20 4e 55 4c 4c 2c 20 72 If P is NULL, r
05e0: 75 6e 20 78 6d 61 6c 6c 6f 63 2e 20 20 2a 2f 0a un xmalloc. */.
05f0: 0a 76 6f 69 64 20 2a 0a 78 72 65 61 6c 6c 6f 63 .void *.xrealloc
0600: 20 28 76 6f 69 64 20 2a 70 2c 20 73 69 7a 65 5f (void *p, size_
0610: 74 20 6e 29 0a 7b 0a 20 20 70 20 3d 20 72 65 61 t n).{. p = rea
0620: 6c 6c 6f 63 20 28 70 2c 20 6e 29 3b 0a 20 20 69 lloc (p, n);. i
0630: 66 20 28 70 20 3d 3d 20 30 29 0a 20 20 20 20 78 f (p == 0). x
0640: 61 6c 6c 6f 63 5f 66 61 69 6c 20 28 29 3b 0a 20 alloc_fail ();.
0650: 20 72 65 74 75 72 6e 20 70 3b 0a 7d 0a 0a 2f 2a return p;.}../*
0660: 20 41 20 60 73 74 72 75 63 74 20 6c 69 6e 65 62 A `struct lineb
0670: 75 66 66 65 72 27 20 68 6f 6c 64 73 20 61 20 6c uffer' holds a l
0680: 69 6e 65 20 6f 66 20 74 65 78 74 2e 20 2a 2f 0a ine of text. */.
0690: 0a 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66 66 .struct linebuff
06a0: 65 72 0a 7b 0a 20 20 73 69 7a 65 5f 74 20 73 69 er.{. size_t si
06b0: 7a 65 3b 09 09 09 2f 2a 20 41 6c 6c 6f 63 61 74 ze;.../* Allocat
06c0: 65 64 2e 20 2a 2f 0a 20 20 73 69 7a 65 5f 74 20 ed. */. size_t
06d0: 6c 65 6e 67 74 68 3b 09 09 2f 2a 20 55 73 65 64 length;../* Used
06e0: 2e 20 2a 2f 0a 20 20 63 68 61 72 20 2a 62 75 66 . */. char *buf
06f0: 66 65 72 3b 0a 7d 3b 0a 0a 2f 2a 20 49 6e 69 74 fer;.};../* Init
0700: 69 61 6c 69 7a 65 20 6c 69 6e 65 62 75 66 66 65 ialize linebuffe
0710: 72 20 4c 49 4e 45 42 55 46 46 45 52 20 66 6f 72 r LINEBUFFER for
0720: 20 75 73 65 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 use. */..static
0730: 20 76 6f 69 64 0a 69 6e 69 74 62 75 66 66 65 72 void.initbuffer
0740: 20 28 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66 (struct linebuf
0750: 66 65 72 20 2a 6c 69 6e 65 62 75 66 66 65 72 29 fer *linebuffer)
0760: 0a 7b 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d .{. linebuffer-
0770: 3e 6c 65 6e 67 74 68 20 3d 20 30 3b 0a 20 20 6c >length = 0;. l
0780: 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20 inebuffer->size
0790: 3d 20 32 30 30 3b 0a 20 20 6c 69 6e 65 62 75 66 = 200;. linebuf
07a0: 66 65 72 2d 3e 62 75 66 66 65 72 20 3d 20 28 63 fer->buffer = (c
07b0: 68 61 72 20 2a 29 20 78 6d 61 6c 6c 6f 63 20 28 har *) xmalloc (
07c0: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 linebuffer->size
07d0: 29 3b 0a 7d 0a 0a 2f 2a 20 52 65 61 64 20 61 6e );.}../* Read an
07e0: 20 61 72 62 69 74 72 61 72 69 6c 79 20 6c 6f 6e arbitrarily lon
07f0: 67 20 6c 69 6e 65 20 6f 66 20 74 65 78 74 20 66 g line of text f
0800: 72 6f 6d 20 53 54 52 45 41 4d 20 69 6e 74 6f 20 rom STREAM into
0810: 4c 49 4e 45 42 55 46 46 45 52 2e 0a 20 20 20 4b LINEBUFFER.. K
0820: 65 65 70 20 74 68 65 20 6e 65 77 6c 69 6e 65 3b eep the newline;
0830: 20 61 70 70 65 6e 64 20 61 20 6e 65 77 6c 69 6e append a newlin
0840: 65 20 69 66 20 69 74 27 73 20 74 68 65 20 6c 61 e if it's the la
0850: 73 74 20 6c 69 6e 65 20 6f 66 20 61 20 66 69 6c st line of a fil
0860: 65 0a 20 20 20 74 68 61 74 20 65 6e 64 73 20 69 e. that ends i
0870: 6e 20 61 20 6e 6f 6e 2d 6e 65 77 6c 69 6e 65 20 n a non-newline
0880: 63 68 61 72 61 63 74 65 72 2e 20 20 44 6f 20 6e character. Do n
0890: 6f 74 20 6e 75 6c 6c 20 74 65 72 6d 69 6e 61 74 ot null terminat
08a0: 65 2e 0a 20 20 20 52 65 74 75 72 6e 20 4c 49 4e e.. Return LIN
08b0: 45 42 55 46 46 45 52 2c 20 65 78 63 65 70 74 20 EBUFFER, except
08c0: 61 74 20 65 6e 64 20 6f 66 20 66 69 6c 65 20 72 at end of file r
08d0: 65 74 75 72 6e 20 30 2e 20 20 2a 2f 0a 0a 73 74 eturn 0. */..st
08e0: 61 74 69 63 20 73 74 72 75 63 74 20 6c 69 6e 65 atic struct line
08f0: 62 75 66 66 65 72 20 2a 0a 72 65 61 64 6c 69 6e buffer *.readlin
0900: 65 20 28 73 74 72 75 63 74 20 6c 69 6e 65 62 75 e (struct linebu
0910: 66 66 65 72 20 2a 6c 69 6e 65 62 75 66 66 65 72 ffer *linebuffer
0920: 2c 20 46 49 4c 45 20 2a 73 74 72 65 61 6d 29 0a , FILE *stream).
0930: 7b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 63 68 61 {. int c;. cha
0940: 72 20 2a 62 75 66 66 65 72 20 3d 20 6c 69 6e 65 r *buffer = line
0950: 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 3b 0a buffer->buffer;.
0960: 20 20 63 68 61 72 20 2a 70 20 3d 20 6c 69 6e 65 char *p = line
0970: 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 3b 0a buffer->buffer;.
0980: 20 20 63 68 61 72 20 2a 65 6e 64 20 3d 20 62 75 char *end = bu
0990: 66 66 65 72 20 2b 20 6c 69 6e 65 62 75 66 66 65 ffer + linebuffe
09a0: 72 2d 3e 73 69 7a 65 20 2d 20 31 3b 20 2f 2a 20 r->size - 1; /*
09b0: 53 65 6e 74 69 6e 65 6c 2e 20 2a 2f 0a 0a 20 20 Sentinel. */..
09c0: 69 66 20 28 66 65 6f 66 20 28 73 74 72 65 61 6d if (feof (stream
09d0: 29 20 7c 7c 20 66 65 72 72 6f 72 20 28 73 74 72 ) || ferror (str
09e0: 65 61 6d 29 29 0a 20 20 20 20 72 65 74 75 72 6e eam)). return
09f0: 20 30 3b 0a 0a 20 20 64 6f 0a 20 20 20 20 7b 0a 0;.. do. {.
0a00: 20 20 20 20 20 20 63 20 3d 20 67 65 74 63 20 28 c = getc (
0a10: 73 74 72 65 61 6d 29 3b 0a 20 20 20 20 20 20 69 stream);. i
0a20: 66 20 28 63 20 3d 3d 20 45 4f 46 29 0a 09 7b 0a f (c == EOF)..{.
0a30: 09 20 20 69 66 20 28 70 20 3d 3d 20 62 75 66 66 . if (p == buff
0a40: 65 72 29 0a 09 20 20 20 20 72 65 74 75 72 6e 20 er).. return
0a50: 30 3b 0a 09 20 20 69 66 20 28 70 5b 2d 31 5d 20 0;.. if (p[-1]
0a60: 3d 3d 20 27 5c 6e 27 29 0a 09 20 20 20 20 62 72 == '\n').. br
0a70: 65 61 6b 3b 0a 09 20 20 63 20 3d 20 27 5c 6e 27 eak;.. c = '\n'
0a80: 3b 0a 09 7d 0a 20 20 20 20 20 20 69 66 20 28 70 ;..}. if (p
0a90: 20 3d 3d 20 65 6e 64 29 0a 09 7b 0a 09 20 20 6c == end)..{.. l
0aa0: 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20 inebuffer->size
0ab0: 2a 3d 20 32 3b 0a 09 20 20 62 75 66 66 65 72 20 *= 2;.. buffer
0ac0: 3d 20 28 63 68 61 72 20 2a 29 20 78 72 65 61 6c = (char *) xreal
0ad0: 6c 6f 63 20 28 62 75 66 66 65 72 2c 20 6c 69 6e loc (buffer, lin
0ae0: 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 29 3b 0a ebuffer->size);.
0af0: 09 20 20 70 20 3d 20 70 20 2d 20 6c 69 6e 65 62 . p = p - lineb
0b00: 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20 2b 20 uffer->buffer +
0b10: 62 75 66 66 65 72 3b 0a 09 20 20 6c 69 6e 65 62 buffer;.. lineb
0b20: 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20 3d 20 uffer->buffer =
0b30: 62 75 66 66 65 72 3b 0a 09 20 20 65 6e 64 20 3d buffer;.. end =
0b40: 20 62 75 66 66 65 72 20 2b 20 6c 69 6e 65 62 75 buffer + linebu
0b50: 66 66 65 72 2d 3e 73 69 7a 65 20 2d 20 31 3b 0a ffer->size - 1;.
0b60: 09 7d 0a 20 20 20 20 20 20 2a 70 2b 2b 20 3d 20 .}. *p++ =
0b70: 63 3b 0a 20 20 20 20 7d 0a 20 20 77 68 69 6c 65 c;. }. while
0b80: 20 28 63 20 21 3d 20 27 5c 6e 27 29 3b 0a 0a 20 (c != '\n');..
0b90: 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 6c 65 6e linebuffer->len
0ba0: 67 74 68 20 3d 20 70 20 2d 20 62 75 66 66 65 72 gth = p - buffer
0bb0: 3b 0a 20 20 72 65 74 75 72 6e 20 6c 69 6e 65 62 ;. return lineb
0bc0: 75 66 66 65 72 3b 0a 7d 0a 0a 2f 2a 20 46 72 65 uffer;.}../* Fre
0bd0: 65 20 6c 69 6e 65 62 75 66 66 65 72 20 4c 49 4e e linebuffer LIN
0be0: 45 42 55 46 46 45 52 27 73 20 64 61 74 61 2e 20 EBUFFER's data.
0bf0: 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69 64 0a */..static void.
0c00: 66 72 65 65 62 75 66 66 65 72 20 28 73 74 72 75 freebuffer (stru
0c10: 63 74 20 6c 69 6e 65 62 75 66 66 65 72 20 2a 6c ct linebuffer *l
0c20: 69 6e 65 62 75 66 66 65 72 29 0a 7b 0a 20 20 66 inebuffer).{. f
0c30: 72 65 65 20 28 6c 69 6e 65 62 75 66 66 65 72 2d ree (linebuffer-
0c40: 3e 62 75 66 66 65 72 29 3b 0a 7d 0a 0a 2f 2a 20 >buffer);.}../*
0c50: 55 6e 64 65 66 69 6e 65 2c 20 74 6f 20 61 76 6f Undefine, to avo
0c60: 69 64 20 77 61 72 6e 69 6e 67 20 61 62 6f 75 74 id warning about
0c70: 20 72 65 64 65 66 69 6e 69 74 69 6f 6e 20 6f 6e redefinition on
0c80: 20 73 6f 6d 65 20 73 79 73 74 65 6d 73 2e 20 20 some systems.
0c90: 2a 2f 0a 23 75 6e 64 65 66 20 6d 69 6e 0a 23 64 */.#undef min.#d
0ca0: 65 66 69 6e 65 20 6d 69 6e 28 78 2c 20 79 29 20 efine min(x, y)
0cb0: 28 28 78 29 20 3c 20 28 79 29 20 3f 20 28 78 29 ((x) < (y) ? (x)
0cc0: 20 3a 20 28 79 29 29 0a 0a 2f 2a 20 52 65 74 75 : (y))../* Retu
0cd0: 72 6e 20 7a 65 72 6f 20 69 66 20 74 77 6f 20 73 rn zero if two s
0ce0: 74 72 69 6e 67 73 20 4f 4c 44 20 61 6e 64 20 4e trings OLD and N
0cf0: 45 57 20 6d 61 74 63 68 2c 20 6e 6f 6e 7a 65 72 EW match, nonzer
0d00: 6f 20 69 66 20 6e 6f 74 2e 0a 20 20 20 4f 4c 44 o if not.. OLD
0d10: 20 61 6e 64 20 4e 45 57 20 70 6f 69 6e 74 20 6e and NEW point n
0d20: 6f 74 20 74 6f 20 74 68 65 20 62 65 67 69 6e 6e ot to the beginn
0d30: 69 6e 67 73 20 6f 66 20 74 68 65 20 6c 69 6e 65 ings of the line
0d40: 73 0a 20 20 20 62 75 74 20 72 61 74 68 65 72 20 s. but rather
0d50: 74 6f 20 74 68 65 20 62 65 67 69 6e 6e 69 6e 67 to the beginning
0d60: 73 20 6f 66 20 74 68 65 20 66 69 65 6c 64 73 20 s of the fields
0d70: 74 6f 20 63 6f 6d 70 61 72 65 2e 0a 20 20 20 4f to compare.. O
0d80: 4c 44 4c 45 4e 20 61 6e 64 20 4e 45 57 4c 45 4e LDLEN and NEWLEN
0d90: 20 61 72 65 20 74 68 65 69 72 20 6c 65 6e 67 74 are their lengt
0da0: 68 73 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 69 hs. */..static i
0db0: 6e 74 0a 64 69 66 66 65 72 65 6e 74 20 28 63 6f nt.different (co
0dc0: 6e 73 74 20 63 68 61 72 20 2a 6f 6c 64 2c 20 63 nst char *old, c
0dd0: 6f 6e 73 74 20 63 68 61 72 20 2a 6e 65 77 2c 20 onst char *new,
0de0: 73 69 7a 65 5f 74 20 6f 6c 64 6c 65 6e 2c 20 73 size_t oldlen, s
0df0: 69 7a 65 5f 74 20 6e 65 77 6c 65 6e 29 0a 7b 0a ize_t newlen).{.
0e00: 20 20 69 6e 74 20 6f 72 64 65 72 3b 0a 0a 20 20 int order;..
0e10: 6f 72 64 65 72 20 3d 20 6d 65 6d 63 6d 70 20 28 order = memcmp (
0e20: 6f 6c 64 2c 20 6e 65 77 2c 20 6d 69 6e 20 28 6f old, new, min (o
0e30: 6c 64 6c 65 6e 2c 20 6e 65 77 6c 65 6e 29 29 3b ldlen, newlen));
0e40: 0a 0a 20 20 69 66 20 28 6f 72 64 65 72 20 3d 3d .. if (order ==
0e50: 20 30 29 0a 20 20 20 20 72 65 74 75 72 6e 20 6f 0). return o
0e60: 6c 64 6c 65 6e 20 2d 20 6e 65 77 6c 65 6e 3b 0a ldlen - newlen;.
0e70: 20 20 72 65 74 75 72 6e 20 6f 72 64 65 72 3b 0a return order;.
0e80: 7d 0a 0a 2f 2a 20 4f 75 74 70 75 74 20 74 68 65 }../* Output the
0e90: 20 6c 69 6e 65 20 69 6e 20 6c 69 6e 65 62 75 66 line in linebuf
0ea0: 66 65 72 20 4c 49 4e 45 20 74 6f 20 73 74 72 65 fer LINE to stre
0eb0: 61 6d 20 53 54 52 45 41 4d 0a 20 20 20 70 72 6f am STREAM. pro
0ec0: 76 69 64 65 64 20 74 68 61 74 20 74 68 65 20 73 vided that the s
0ed0: 77 69 74 63 68 65 73 20 73 61 79 20 69 74 20 73 witches say it s
0ee0: 68 6f 75 6c 64 20 62 65 20 6f 75 74 70 75 74 2e hould be output.
0ef0: 0a 20 20 20 49 66 20 72 65 71 75 65 73 74 65 64 . If requested
0f00: 2c 20 70 72 69 6e 74 20 74 68 65 20 6e 75 6d 62 , print the numb
0f10: 65 72 20 6f 66 20 74 69 6d 65 73 20 69 74 20 6f er of times it o
0f20: 63 63 75 72 72 65 64 2c 20 61 73 20 77 65 6c 6c ccurred, as well
0f30: 3b 0a 20 20 20 4c 49 4e 45 43 4f 55 4e 54 20 2b ;. LINECOUNT +
0f40: 20 31 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72 1 is the number
0f50: 20 6f 66 20 74 69 6d 65 73 20 74 68 61 74 20 74 of times that t
0f60: 68 65 20 6c 69 6e 65 20 6f 63 63 75 72 72 65 64 he line occurred
0f70: 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69 . */..static voi
0f80: 64 0a 77 72 69 74 65 6c 69 6e 65 20 28 63 6f 6e d.writeline (con
0f90: 73 74 20 73 74 72 75 63 74 20 6c 69 6e 65 62 75 st struct linebu
0fa0: 66 66 65 72 20 2a 6c 69 6e 65 2c 20 46 49 4c 45 ffer *line, FILE
0fb0: 20 2a 73 74 72 65 61 6d 2c 20 69 6e 74 20 6c 69 *stream, int li
0fc0: 6e 65 63 6f 75 6e 74 29 0a 7b 0a 20 20 69 66 20 necount).{. if
0fd0: 28 6c 69 6e 65 63 6f 75 6e 74 20 3d 3d 20 30 29 (linecount == 0)
0fe0: 0a 20 20 20 20 66 77 72 69 74 65 20 28 6c 69 6e . fwrite (lin
0ff0: 65 2d 3e 62 75 66 66 65 72 2c 20 31 2c 20 6c 69 e->buffer, 1, li
1000: 6e 65 2d 3e 6c 65 6e 67 74 68 2c 20 73 74 72 65 ne->length, stre
1010: 61 6d 29 3b 0a 7d 0a 0a 2f 2a 20 50 72 6f 63 65 am);.}../* Proce
1020: 73 73 20 69 6e 70 75 74 20 66 69 6c 65 20 49 4e ss input file IN
1030: 46 49 4c 45 20 77 69 74 68 20 6f 75 74 70 75 74 FILE with output
1040: 20 74 6f 20 4f 55 54 46 49 4c 45 2e 0a 20 20 20 to OUTFILE..
1050: 49 66 20 65 69 74 68 65 72 20 69 73 20 22 2d 22 If either is "-"
1060: 2c 20 75 73 65 20 74 68 65 20 73 74 61 6e 64 61 , use the standa
1070: 72 64 20 49 2f 4f 20 73 74 72 65 61 6d 20 66 6f rd I/O stream fo
1080: 72 20 69 74 20 69 6e 73 74 65 61 64 2e 20 2a 2f r it instead. */
1090: 0a 0a 73 74 61 74 69 63 20 76 6f 69 64 0a 63 68 ..static void.ch
10a0: 65 63 6b 5f 66 69 6c 65 20 28 63 6f 6e 73 74 20 eck_file (const
10b0: 63 68 61 72 20 2a 69 6e 66 69 6c 65 2c 20 63 6f char *infile, co
10c0: 6e 73 74 20 63 68 61 72 20 2a 6f 75 74 66 69 6c nst char *outfil
10d0: 65 29 0a 7b 0a 20 20 46 49 4c 45 20 2a 69 73 74 e).{. FILE *ist
10e0: 72 65 61 6d 3b 0a 20 20 46 49 4c 45 20 2a 6f 73 ream;. FILE *os
10f0: 74 72 65 61 6d 3b 0a 20 20 73 74 72 75 63 74 20 tream;. struct
1100: 6c 69 6e 65 62 75 66 66 65 72 20 6c 62 31 2c 20 linebuffer lb1,
1110: 6c 62 32 3b 0a 20 20 73 74 72 75 63 74 20 6c 69 lb2;. struct li
1120: 6e 65 62 75 66 66 65 72 20 2a 74 68 69 73 6c 69 nebuffer *thisli
1130: 6e 65 2c 20 2a 70 72 65 76 6c 69 6e 65 2c 20 2a ne, *prevline, *
1140: 65 78 63 68 3b 0a 20 20 63 68 61 72 20 2a 70 72 exch;. char *pr
1150: 65 76 66 69 65 6c 64 2c 20 2a 74 68 69 73 66 69 evfield, *thisfi
1160: 65 6c 64 3b 0a 20 20 73 69 7a 65 5f 74 20 70 72 eld;. size_t pr
1170: 65 76 6c 65 6e 2c 20 74 68 69 73 6c 65 6e 3b 0a evlen, thislen;.
1180: 20 20 69 6e 74 20 6d 61 74 63 68 5f 63 6f 75 6e int match_coun
1190: 74 20 3d 20 30 3b 0a 0a 20 20 69 66 20 28 21 73 t = 0;.. if (!s
11a0: 74 72 63 6d 70 20 28 69 6e 66 69 6c 65 2c 20 22 trcmp (infile, "
11b0: 2d 22 29 29 0a 20 20 20 20 69 73 74 72 65 61 6d -")). istream
11c0: 20 3d 20 73 74 64 69 6e 3b 0a 20 20 65 6c 73 65 = stdin;. else
11d0: 0a 20 20 20 20 69 73 74 72 65 61 6d 20 3d 20 66 . istream = f
11e0: 6f 70 65 6e 20 28 69 6e 66 69 6c 65 2c 20 22 72 open (infile, "r
11f0: 22 29 3b 0a 20 20 69 66 20 28 69 73 74 72 65 61 ");. if (istrea
1200: 6d 20 3d 3d 20 4e 55 4c 4c 29 0a 20 20 20 20 7b m == NULL). {
1210: 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28 . fprintf (
1220: 73 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72 stderr, "%s: err
1230: 6f 72 20 6f 70 65 6e 69 6e 67 20 25 73 5c 6e 22 or opening %s\n"
1240: 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 , program_name,
1250: 69 6e 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65 infile);. e
1260: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a xit (1);. }..
1270: 20 20 69 66 20 28 21 73 74 72 63 6d 70 20 28 6f if (!strcmp (o
1280: 75 74 66 69 6c 65 2c 20 22 2d 22 29 29 0a 20 20 utfile, "-")).
1290: 20 20 6f 73 74 72 65 61 6d 20 3d 20 73 74 64 6f ostream = stdo
12a0: 75 74 3b 0a 20 20 65 6c 73 65 0a 20 20 20 20 6f ut;. else. o
12b0: 73 74 72 65 61 6d 20 3d 20 66 6f 70 65 6e 20 28 stream = fopen (
12c0: 6f 75 74 66 69 6c 65 2c 20 22 77 22 29 3b 0a 20 outfile, "w");.
12d0: 20 69 66 20 28 6f 73 74 72 65 61 6d 20 3d 3d 20 if (ostream ==
12e0: 4e 55 4c 4c 29 0a 20 20 20 20 7b 0a 20 20 20 20 NULL). {.
12f0: 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 65 72 fprintf (stder
1300: 72 2c 20 22 25 73 3a 20 65 72 72 6f 72 20 6f 70 r, "%s: error op
1310: 65 6e 69 6e 67 20 25 73 5c 6e 22 2c 20 70 72 6f ening %s\n", pro
1320: 67 72 61 6d 5f 6e 61 6d 65 2c 20 6f 75 74 66 69 gram_name, outfi
1330: 6c 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20 le);. exit
1340: 28 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 74 68 (1);. }.. th
1350: 69 73 6c 69 6e 65 20 3d 20 26 6c 62 31 3b 0a 20 isline = &lb1;.
1360: 20 70 72 65 76 6c 69 6e 65 20 3d 20 26 6c 62 32 prevline = &lb2
1370: 3b 0a 0a 20 20 69 6e 69 74 62 75 66 66 65 72 20 ;.. initbuffer
1380: 28 74 68 69 73 6c 69 6e 65 29 3b 0a 20 20 69 6e (thisline);. in
1390: 69 74 62 75 66 66 65 72 20 28 70 72 65 76 6c 69 itbuffer (prevli
13a0: 6e 65 29 3b 0a 0a 20 20 69 66 20 28 72 65 61 64 ne);.. if (read
13b0: 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e 65 2c 20 line (prevline,
13c0: 69 73 74 72 65 61 6d 29 20 3d 3d 20 30 29 0a 20 istream) == 0).
13d0: 20 20 20 67 6f 74 6f 20 63 6c 6f 73 65 66 69 6c goto closefil
13e0: 65 73 3b 0a 20 20 70 72 65 76 66 69 65 6c 64 20 es;. prevfield
13f0: 3d 20 70 72 65 76 6c 69 6e 65 2d 3e 62 75 66 66 = prevline->buff
1400: 65 72 3b 0a 20 20 70 72 65 76 6c 65 6e 20 3d 20 er;. prevlen =
1410: 70 72 65 76 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68 prevline->length
1420: 3b 0a 0a 20 20 77 68 69 6c 65 20 28 21 66 65 6f ;.. while (!feo
1430: 66 20 28 69 73 74 72 65 61 6d 29 29 0a 20 20 20 f (istream)).
1440: 20 7b 0a 20 20 20 20 20 20 69 6e 74 20 6d 61 74 {. int mat
1450: 63 68 3b 0a 20 20 20 20 20 20 69 66 20 28 72 65 ch;. if (re
1460: 61 64 6c 69 6e 65 20 28 74 68 69 73 6c 69 6e 65 adline (thisline
1470: 2c 20 69 73 74 72 65 61 6d 29 20 3d 3d 20 30 29 , istream) == 0)
1480: 0a 09 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 74 ..break;. t
1490: 68 69 73 66 69 65 6c 64 20 3d 20 74 68 69 73 6c hisfield = thisl
14a0: 69 6e 65 2d 3e 62 75 66 66 65 72 3b 0a 20 20 20 ine->buffer;.
14b0: 20 20 20 74 68 69 73 6c 65 6e 20 3d 20 74 68 69 thislen = thi
14c0: 73 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68 3b 0a 20 sline->length;.
14d0: 20 20 20 20 20 6d 61 74 63 68 20 3d 20 21 64 69 match = !di
14e0: 66 66 65 72 65 6e 74 20 28 74 68 69 73 66 69 65 fferent (thisfie
14f0: 6c 64 2c 20 70 72 65 76 66 69 65 6c 64 2c 20 74 ld, prevfield, t
1500: 68 69 73 6c 65 6e 2c 20 70 72 65 76 6c 65 6e 29 hislen, prevlen)
1510: 3b 0a 0a 20 20 20 20 20 20 69 66 20 28 6d 61 74 ;.. if (mat
1520: 63 68 29 0a 09 2b 2b 6d 61 74 63 68 5f 63 6f 75 ch)..++match_cou
1530: 6e 74 3b 0a 0a 20 20 20 20 20 20 69 66 20 28 21 nt;.. if (!
1540: 6d 61 74 63 68 29 0a 09 7b 0a 09 20 20 77 72 69 match)..{.. wri
1550: 74 65 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e 65 teline (prevline
1560: 2c 20 6f 73 74 72 65 61 6d 2c 20 6d 61 74 63 68 , ostream, match
1570: 5f 63 6f 75 6e 74 29 3b 0a 09 20 20 65 78 63 68 _count);.. exch
1580: 20 3d 20 70 72 65 76 6c 69 6e 65 3b 0a 09 20 20 = prevline;..
1590: 70 72 65 76 6c 69 6e 65 20 3d 20 74 68 69 73 6c prevline = thisl
15a0: 69 6e 65 3b 0a 09 20 20 74 68 69 73 6c 69 6e 65 ine;.. thisline
15b0: 20 3d 20 65 78 63 68 3b 0a 09 20 20 70 72 65 76 = exch;.. prev
15c0: 66 69 65 6c 64 20 3d 20 74 68 69 73 66 69 65 6c field = thisfiel
15d0: 64 3b 0a 09 20 20 70 72 65 76 6c 65 6e 20 3d 20 d;.. prevlen =
15e0: 74 68 69 73 6c 65 6e 3b 0a 09 20 20 69 66 20 28 thislen;.. if (
15f0: 21 6d 61 74 63 68 29 0a 09 20 20 20 20 6d 61 74 !match).. mat
1600: 63 68 5f 63 6f 75 6e 74 20 3d 20 30 3b 0a 09 7d ch_count = 0;..}
1610: 0a 20 20 20 20 7d 0a 0a 20 20 77 72 69 74 65 6c . }.. writel
1620: 69 6e 65 20 28 70 72 65 76 6c 69 6e 65 2c 20 6f ine (prevline, o
1630: 73 74 72 65 61 6d 2c 20 6d 61 74 63 68 5f 63 6f stream, match_co
1640: 75 6e 74 29 3b 0a 0a 20 63 6c 6f 73 65 66 69 6c unt);.. closefil
1650: 65 73 3a 0a 20 20 69 66 20 28 66 65 72 72 6f 72 es:. if (ferror
1660: 20 28 69 73 74 72 65 61 6d 29 20 7c 7c 20 66 63 (istream) || fc
1670: 6c 6f 73 65 20 28 69 73 74 72 65 61 6d 29 20 3d lose (istream) =
1680: 3d 20 45 4f 46 29 0a 20 20 20 20 7b 0a 20 20 20 = EOF). {.
1690: 20 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 65 fprintf (stde
16a0: 72 72 2c 20 22 25 73 3a 20 65 72 72 6f 72 20 72 rr, "%s: error r
16b0: 65 61 64 69 6e 67 20 25 73 5c 6e 22 2c 20 70 72 eading %s\n", pr
16c0: 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 69 6e 66 69 ogram_name, infi
16d0: 6c 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20 le);. exit
16e0: 28 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 69 66 (1);. }.. if
16f0: 20 28 66 65 72 72 6f 72 20 28 6f 73 74 72 65 61 (ferror (ostrea
1700: 6d 29 20 7c 7c 20 66 63 6c 6f 73 65 20 28 6f 73 m) || fclose (os
1710: 74 72 65 61 6d 29 20 3d 3d 20 45 4f 46 29 0a 20 tream) == EOF).
1720: 20 20 20 7b 0a 20 20 20 20 20 20 66 70 72 69 6e {. fprin
1730: 74 66 20 28 73 74 64 65 72 72 2c 20 22 25 73 3a tf (stderr, "%s:
1740: 20 65 72 72 6f 72 20 77 72 69 74 69 6e 67 20 25 error writing %
1750: 73 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 s\n", program_na
1760: 6d 65 2c 20 6f 75 74 66 69 6c 65 29 3b 0a 20 20 me, outfile);.
1770: 20 20 20 20 65 78 69 74 20 28 31 29 3b 0a 20 20 exit (1);.
1780: 20 20 7d 0a 0a 20 20 66 72 65 65 62 75 66 66 65 }.. freebuffe
1790: 72 20 28 26 6c 62 31 29 3b 0a 20 20 66 72 65 65 r (&lb1);. free
17a0: 62 75 66 66 65 72 20 28 26 6c 62 32 29 3b 0a 7d buffer (&lb2);.}
17b0: 0a 0a 69 6e 74 0a 6d 61 69 6e 20 28 69 6e 74 20 ..int.main (int
17c0: 61 72 67 63 2c 20 63 68 61 72 20 2a 2a 61 72 67 argc, char **arg
17d0: 76 29 0a 7b 0a 20 20 63 6f 6e 73 74 20 63 68 61 v).{. const cha
17e0: 72 20 2a 69 6e 66 69 6c 65 20 3d 20 22 2d 22 3b r *infile = "-";
17f0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f . const char *o
1800: 75 74 66 69 6c 65 20 3d 20 22 2d 22 3b 0a 20 20 utfile = "-";.
1810: 69 6e 74 20 6f 70 74 69 6e 64 20 3d 20 31 3b 0a int optind = 1;.
1820: 0a 20 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 20 . program_name
1830: 3d 20 61 72 67 76 5b 30 5d 3b 0a 0a 20 20 69 66 = argv[0];.. if
1840: 20 28 6f 70 74 69 6e 64 20 3c 20 61 72 67 63 29 (optind < argc)
1850: 0a 20 20 20 20 69 6e 66 69 6c 65 20 3d 20 61 72 . infile = ar
1860: 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d 3b 0a 0a 20 gv[optind++];..
1870: 20 69 66 20 28 6f 70 74 69 6e 64 20 3c 20 61 72 if (optind < ar
1880: 67 63 29 0a 20 20 20 20 6f 75 74 66 69 6c 65 20 gc). outfile
1890: 3d 20 61 72 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d = argv[optind++]
18a0: 3b 0a 0a 20 20 69 66 20 28 6f 70 74 69 6e 64 20 ;.. if (optind
18b0: 3c 20 61 72 67 63 29 0a 20 20 20 20 7b 0a 20 20 < argc). {.
18c0: 20 20 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 fprintf (std
18d0: 65 72 72 2c 20 22 25 73 3a 20 74 6f 6f 20 6d 61 err, "%s: too ma
18e0: 6e 79 20 61 72 67 75 6d 65 6e 74 73 5c 6e 22 2c ny arguments\n",
18f0: 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 29 3b 0a program_name);.
1900: 20 20 20 20 20 20 65 78 69 74 20 28 31 29 3b 0a exit (1);.
1910: 20 20 20 20 7d 0a 0a 20 20 63 68 65 63 6b 5f 66 }.. check_f
1920: 69 6c 65 20 28 69 6e 66 69 6c 65 2c 20 6f 75 74 ile (infile, out
1930: 66 69 6c 65 29 3b 0a 0a 20 20 65 78 69 74 20 28 file);.. exit (
1940: 30 29 3b 0a 7d 0a 0);.}.