Artifact 1c4d0223d6144ce60e473833460c3b6272489bce:


0000: 2f 2a 20 75 6e 69 71 20 2d 2d 20 72 65 6d 6f 76  /* uniq -- remov
0010: 65 20 64 75 70 6c 69 63 61 74 65 20 6c 69 6e 65  e duplicate line
0020: 73 20 66 72 6f 6d 20 61 20 73 6f 72 74 65 64 20  s from a sorted 
0030: 66 69 6c 65 0a 20 20 20 43 6f 70 79 72 69 67 68  file.   Copyrigh
0040: 74 20 28 43 29 20 38 36 2c 20 39 31 2c 20 31 39  t (C) 86, 91, 19
0050: 39 35 2d 31 39 39 38 2c 20 31 39 39 39 20 46 72  95-1998, 1999 Fr
0060: 65 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e  ee Software Foun
0070: 64 61 74 69 6f 6e 2c 20 49 6e 63 2e 0a 0a 20 20  dation, Inc...  
0080: 20 54 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73   This program is
0090: 20 66 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20   free software; 
00a0: 79 6f 75 20 63 61 6e 20 72 65 64 69 73 74 72 69  you can redistri
00b0: 62 75 74 65 20 69 74 20 61 6e 64 2f 6f 72 20 6d  bute it and/or m
00c0: 6f 64 69 66 79 0a 20 20 20 69 74 20 75 6e 64 65  odify.   it unde
00d0: 72 20 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74  r the terms of t
00e0: 68 65 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50  he GNU General P
00f0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 61 73  ublic License as
0100: 20 70 75 62 6c 69 73 68 65 64 20 62 79 0a 20 20   published by.  
0110: 20 74 68 65 20 46 72 65 65 20 53 6f 66 74 77 61   the Free Softwa
0120: 72 65 20 46 6f 75 6e 64 61 74 69 6f 6e 3b 20 65  re Foundation; e
0130: 69 74 68 65 72 20 76 65 72 73 69 6f 6e 20 32 2c  ither version 2,
0140: 20 6f 72 20 28 61 74 20 79 6f 75 72 20 6f 70 74   or (at your opt
0150: 69 6f 6e 29 0a 20 20 20 61 6e 79 20 6c 61 74 65  ion).   any late
0160: 72 20 76 65 72 73 69 6f 6e 2e 0a 0a 20 20 20 54  r version...   T
0170: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64  his program is d
0180: 69 73 74 72 69 62 75 74 65 64 20 69 6e 20 74 68  istributed in th
0190: 65 20 68 6f 70 65 20 74 68 61 74 20 69 74 20 77  e hope that it w
01a0: 69 6c 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 20  ill be useful,. 
01b0: 20 20 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e    but WITHOUT AN
01c0: 59 20 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68  Y WARRANTY; with
01d0: 6f 75 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70  out even the imp
01e0: 6c 69 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66  lied warranty of
01f0: 0a 20 20 20 4d 45 52 43 48 41 4e 54 41 42 49 4c  .   MERCHANTABIL
0200: 49 54 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46  ITY or FITNESS F
0210: 4f 52 20 41 20 50 41 52 54 49 43 55 4c 41 52 20  OR A PARTICULAR 
0220: 50 55 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68  PURPOSE.  See th
0230: 65 0a 20 20 20 47 4e 55 20 47 65 6e 65 72 61 6c  e.   GNU General
0240: 20 50 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20   Public License 
0250: 66 6f 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73  for more details
0260: 2e 0a 0a 20 20 20 59 6f 75 20 73 68 6f 75 6c 64  ...   You should
0270: 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 61   have received a
0280: 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e 55   copy of the GNU
0290: 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 20   General Public 
02a0: 4c 69 63 65 6e 73 65 0a 20 20 20 61 6c 6f 6e 67  License.   along
02b0: 20 77 69 74 68 20 74 68 69 73 20 70 72 6f 67 72   with this progr
02c0: 61 6d 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 74  am; if not, writ
02d0: 65 20 74 6f 20 74 68 65 20 46 72 65 65 20 53 6f  e to the Free So
02e0: 66 74 77 61 72 65 20 46 6f 75 6e 64 61 74 69 6f  ftware Foundatio
02f0: 6e 2c 0a 20 20 20 49 6e 63 2e 2c 20 35 39 20 54  n,.   Inc., 59 T
0300: 65 6d 70 6c 65 20 50 6c 61 63 65 20 2d 20 53 75  emple Place - Su
0310: 69 74 65 20 33 33 30 2c 20 42 6f 73 74 6f 6e 2c  ite 330, Boston,
0320: 20 4d 41 20 30 32 31 31 31 2d 31 33 30 37 2c 20   MA 02111-1307, 
0330: 55 53 41 2e 20 20 2a 2f 0a 0a 2f 2a 20 57 72 69  USA.  */../* Wri
0340: 74 74 65 6e 20 62 79 20 52 69 63 68 61 72 64 20  tten by Richard 
0350: 53 74 61 6c 6c 6d 61 6e 20 61 6e 64 20 44 61 76  Stallman and Dav
0360: 69 64 20 4d 61 63 4b 65 6e 7a 69 65 2e 20 2a 2f  id MacKenzie. */
0370: 0a 2f 2a 20 32 30 30 30 2d 30 33 2d 32 32 20 20  ./* 2000-03-22  
0380: 54 72 69 6d 6d 65 64 20 64 6f 77 6e 20 74 6f 20  Trimmed down to 
0390: 74 68 65 20 63 61 73 65 20 6f 66 20 22 75 6e 69  the case of "uni
03a0: 71 20 2d 75 22 20 62 79 20 42 72 75 6e 6f 20 48  q -u" by Bruno H
03b0: 61 69 62 6c 65 2e 20 2a 2f 0a 0a 23 69 6e 63 6c  aible. */..#incl
03c0: 75 64 65 20 3c 73 74 64 64 65 66 2e 68 3e 0a 23  ude <stddef.h>.#
03d0: 69 6e 63 6c 75 64 65 20 3c 73 74 64 69 6f 2e 68  include <stdio.h
03e0: 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 74 64 6c  >.#include <stdl
03f0: 69 62 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c  ib.h>.#include <
0400: 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f 2a 20 54 68  string.h>../* Th
0410: 65 20 6e 61 6d 65 20 74 68 69 73 20 70 72 6f 67  e name this prog
0420: 72 61 6d 20 77 61 73 20 72 75 6e 20 77 69 74 68  ram was run with
0430: 2e 20 2a 2f 0a 73 74 61 74 69 63 20 63 68 61 72  . */.static char
0440: 20 2a 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 3b 0a   *program_name;.
0450: 0a 73 74 61 74 69 63 20 76 6f 69 64 0a 78 61 6c  .static void.xal
0460: 6c 6f 63 5f 66 61 69 6c 20 28 76 6f 69 64 29 0a  loc_fail (void).
0470: 7b 0a 20 20 66 70 72 69 6e 74 66 20 28 73 74 64  {.  fprintf (std
0480: 65 72 72 2c 20 22 25 73 3a 20 76 69 72 74 75 61  err, "%s: virtua
0490: 6c 20 6d 65 6d 6f 72 79 20 65 78 68 61 75 73 74  l memory exhaust
04a0: 65 64 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e  ed\n", program_n
04b0: 61 6d 65 29 3b 0a 20 20 65 78 69 74 20 28 31 29  ame);.  exit (1)
04c0: 3b 0a 7d 0a 0a 2f 2a 20 41 6c 6c 6f 63 61 74 65  ;.}../* Allocate
04d0: 20 4e 20 62 79 74 65 73 20 6f 66 20 6d 65 6d 6f   N bytes of memo
04e0: 72 79 20 64 79 6e 61 6d 69 63 61 6c 6c 79 2c 20  ry dynamically, 
04f0: 77 69 74 68 20 65 72 72 6f 72 20 63 68 65 63 6b  with error check
0500: 69 6e 67 2e 20 20 2a 2f 0a 0a 76 6f 69 64 20 2a  ing.  */..void *
0510: 0a 78 6d 61 6c 6c 6f 63 20 28 73 69 7a 65 5f 74  .xmalloc (size_t
0520: 20 6e 29 0a 7b 0a 20 20 76 6f 69 64 20 2a 70 3b   n).{.  void *p;
0530: 0a 0a 20 20 70 20 3d 20 6d 61 6c 6c 6f 63 20 28  ..  p = malloc (
0540: 6e 29 3b 0a 20 20 69 66 20 28 70 20 3d 3d 20 30  n);.  if (p == 0
0550: 29 0a 20 20 20 20 78 61 6c 6c 6f 63 5f 66 61 69  ).    xalloc_fai
0560: 6c 20 28 29 3b 0a 20 20 72 65 74 75 72 6e 20 70  l ();.  return p
0570: 3b 0a 7d 0a 0a 2f 2a 20 43 68 61 6e 67 65 20 74  ;.}../* Change t
0580: 68 65 20 73 69 7a 65 20 6f 66 20 61 6e 20 61 6c  he size of an al
0590: 6c 6f 63 61 74 65 64 20 62 6c 6f 63 6b 20 6f 66  located block of
05a0: 20 6d 65 6d 6f 72 79 20 50 20 74 6f 20 4e 20 62   memory P to N b
05b0: 79 74 65 73 2c 0a 20 20 20 77 69 74 68 20 65 72  ytes,.   with er
05c0: 72 6f 72 20 63 68 65 63 6b 69 6e 67 2e 0a 20 20  ror checking..  
05d0: 20 49 66 20 50 20 69 73 20 4e 55 4c 4c 2c 20 72   If P is NULL, r
05e0: 75 6e 20 78 6d 61 6c 6c 6f 63 2e 20 20 2a 2f 0a  un xmalloc.  */.
05f0: 0a 76 6f 69 64 20 2a 0a 78 72 65 61 6c 6c 6f 63  .void *.xrealloc
0600: 20 28 76 6f 69 64 20 2a 70 2c 20 73 69 7a 65 5f   (void *p, size_
0610: 74 20 6e 29 0a 7b 0a 20 20 70 20 3d 20 72 65 61  t n).{.  p = rea
0620: 6c 6c 6f 63 20 28 70 2c 20 6e 29 3b 0a 20 20 69  lloc (p, n);.  i
0630: 66 20 28 70 20 3d 3d 20 30 29 0a 20 20 20 20 78  f (p == 0).    x
0640: 61 6c 6c 6f 63 5f 66 61 69 6c 20 28 29 3b 0a 20  alloc_fail ();. 
0650: 20 72 65 74 75 72 6e 20 70 3b 0a 7d 0a 0a 2f 2a   return p;.}../*
0660: 20 41 20 60 73 74 72 75 63 74 20 6c 69 6e 65 62   A `struct lineb
0670: 75 66 66 65 72 27 20 68 6f 6c 64 73 20 61 20 6c  uffer' holds a l
0680: 69 6e 65 20 6f 66 20 74 65 78 74 2e 20 2a 2f 0a  ine of text. */.
0690: 0a 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66 66  .struct linebuff
06a0: 65 72 0a 7b 0a 20 20 73 69 7a 65 5f 74 20 73 69  er.{.  size_t si
06b0: 7a 65 3b 09 09 09 2f 2a 20 41 6c 6c 6f 63 61 74  ze;.../* Allocat
06c0: 65 64 2e 20 2a 2f 0a 20 20 73 69 7a 65 5f 74 20  ed. */.  size_t 
06d0: 6c 65 6e 67 74 68 3b 09 09 2f 2a 20 55 73 65 64  length;../* Used
06e0: 2e 20 2a 2f 0a 20 20 63 68 61 72 20 2a 62 75 66  . */.  char *buf
06f0: 66 65 72 3b 0a 7d 3b 0a 0a 2f 2a 20 49 6e 69 74  fer;.};../* Init
0700: 69 61 6c 69 7a 65 20 6c 69 6e 65 62 75 66 66 65  ialize linebuffe
0710: 72 20 4c 49 4e 45 42 55 46 46 45 52 20 66 6f 72  r LINEBUFFER for
0720: 20 75 73 65 2e 20 2a 2f 0a 0a 73 74 61 74 69 63   use. */..static
0730: 20 76 6f 69 64 0a 69 6e 69 74 62 75 66 66 65 72   void.initbuffer
0740: 20 28 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66   (struct linebuf
0750: 66 65 72 20 2a 6c 69 6e 65 62 75 66 66 65 72 29  fer *linebuffer)
0760: 0a 7b 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d  .{.  linebuffer-
0770: 3e 6c 65 6e 67 74 68 20 3d 20 30 3b 0a 20 20 6c  >length = 0;.  l
0780: 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20  inebuffer->size 
0790: 3d 20 32 30 30 3b 0a 20 20 6c 69 6e 65 62 75 66  = 200;.  linebuf
07a0: 66 65 72 2d 3e 62 75 66 66 65 72 20 3d 20 28 63  fer->buffer = (c
07b0: 68 61 72 20 2a 29 20 78 6d 61 6c 6c 6f 63 20 28  har *) xmalloc (
07c0: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65  linebuffer->size
07d0: 29 3b 0a 7d 0a 0a 2f 2a 20 52 65 61 64 20 61 6e  );.}../* Read an
07e0: 20 61 72 62 69 74 72 61 72 69 6c 79 20 6c 6f 6e   arbitrarily lon
07f0: 67 20 6c 69 6e 65 20 6f 66 20 74 65 78 74 20 66  g line of text f
0800: 72 6f 6d 20 53 54 52 45 41 4d 20 69 6e 74 6f 20  rom STREAM into 
0810: 4c 49 4e 45 42 55 46 46 45 52 2e 0a 20 20 20 4b  LINEBUFFER..   K
0820: 65 65 70 20 74 68 65 20 6e 65 77 6c 69 6e 65 3b  eep the newline;
0830: 20 61 70 70 65 6e 64 20 61 20 6e 65 77 6c 69 6e   append a newlin
0840: 65 20 69 66 20 69 74 27 73 20 74 68 65 20 6c 61  e if it's the la
0850: 73 74 20 6c 69 6e 65 20 6f 66 20 61 20 66 69 6c  st line of a fil
0860: 65 0a 20 20 20 74 68 61 74 20 65 6e 64 73 20 69  e.   that ends i
0870: 6e 20 61 20 6e 6f 6e 2d 6e 65 77 6c 69 6e 65 20  n a non-newline 
0880: 63 68 61 72 61 63 74 65 72 2e 20 20 44 6f 20 6e  character.  Do n
0890: 6f 74 20 6e 75 6c 6c 20 74 65 72 6d 69 6e 61 74  ot null terminat
08a0: 65 2e 0a 20 20 20 52 65 74 75 72 6e 20 4c 49 4e  e..   Return LIN
08b0: 45 42 55 46 46 45 52 2c 20 65 78 63 65 70 74 20  EBUFFER, except 
08c0: 61 74 20 65 6e 64 20 6f 66 20 66 69 6c 65 20 72  at end of file r
08d0: 65 74 75 72 6e 20 30 2e 20 20 2a 2f 0a 0a 73 74  eturn 0.  */..st
08e0: 61 74 69 63 20 73 74 72 75 63 74 20 6c 69 6e 65  atic struct line
08f0: 62 75 66 66 65 72 20 2a 0a 72 65 61 64 6c 69 6e  buffer *.readlin
0900: 65 20 28 73 74 72 75 63 74 20 6c 69 6e 65 62 75  e (struct linebu
0910: 66 66 65 72 20 2a 6c 69 6e 65 62 75 66 66 65 72  ffer *linebuffer
0920: 2c 20 46 49 4c 45 20 2a 73 74 72 65 61 6d 29 0a  , FILE *stream).
0930: 7b 0a 20 20 69 6e 74 20 63 3b 0a 20 20 63 68 61  {.  int c;.  cha
0940: 72 20 2a 62 75 66 66 65 72 20 3d 20 6c 69 6e 65  r *buffer = line
0950: 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 3b 0a  buffer->buffer;.
0960: 20 20 63 68 61 72 20 2a 70 20 3d 20 6c 69 6e 65    char *p = line
0970: 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 3b 0a  buffer->buffer;.
0980: 20 20 63 68 61 72 20 2a 65 6e 64 20 3d 20 62 75    char *end = bu
0990: 66 66 65 72 20 2b 20 6c 69 6e 65 62 75 66 66 65  ffer + linebuffe
09a0: 72 2d 3e 73 69 7a 65 20 2d 20 31 3b 20 2f 2a 20  r->size - 1; /* 
09b0: 53 65 6e 74 69 6e 65 6c 2e 20 2a 2f 0a 0a 20 20  Sentinel. */..  
09c0: 69 66 20 28 66 65 6f 66 20 28 73 74 72 65 61 6d  if (feof (stream
09d0: 29 20 7c 7c 20 66 65 72 72 6f 72 20 28 73 74 72  ) || ferror (str
09e0: 65 61 6d 29 29 0a 20 20 20 20 72 65 74 75 72 6e  eam)).    return
09f0: 20 30 3b 0a 0a 20 20 64 6f 0a 20 20 20 20 7b 0a   0;..  do.    {.
0a00: 20 20 20 20 20 20 63 20 3d 20 67 65 74 63 20 28        c = getc (
0a10: 73 74 72 65 61 6d 29 3b 0a 20 20 20 20 20 20 69  stream);.      i
0a20: 66 20 28 63 20 3d 3d 20 45 4f 46 29 0a 09 7b 0a  f (c == EOF)..{.
0a30: 09 20 20 69 66 20 28 70 20 3d 3d 20 62 75 66 66  .  if (p == buff
0a40: 65 72 29 0a 09 20 20 20 20 72 65 74 75 72 6e 20  er)..    return 
0a50: 30 3b 0a 09 20 20 69 66 20 28 70 5b 2d 31 5d 20  0;..  if (p[-1] 
0a60: 3d 3d 20 27 5c 6e 27 29 0a 09 20 20 20 20 62 72  == '\n')..    br
0a70: 65 61 6b 3b 0a 09 20 20 63 20 3d 20 27 5c 6e 27  eak;..  c = '\n'
0a80: 3b 0a 09 7d 0a 20 20 20 20 20 20 69 66 20 28 70  ;..}.      if (p
0a90: 20 3d 3d 20 65 6e 64 29 0a 09 7b 0a 09 20 20 6c   == end)..{..  l
0aa0: 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20  inebuffer->size 
0ab0: 2a 3d 20 32 3b 0a 09 20 20 62 75 66 66 65 72 20  *= 2;..  buffer 
0ac0: 3d 20 28 63 68 61 72 20 2a 29 20 78 72 65 61 6c  = (char *) xreal
0ad0: 6c 6f 63 20 28 62 75 66 66 65 72 2c 20 6c 69 6e  loc (buffer, lin
0ae0: 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 29 3b 0a  ebuffer->size);.
0af0: 09 20 20 70 20 3d 20 70 20 2d 20 6c 69 6e 65 62  .  p = p - lineb
0b00: 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20 2b 20  uffer->buffer + 
0b10: 62 75 66 66 65 72 3b 0a 09 20 20 6c 69 6e 65 62  buffer;..  lineb
0b20: 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20 3d 20  uffer->buffer = 
0b30: 62 75 66 66 65 72 3b 0a 09 20 20 65 6e 64 20 3d  buffer;..  end =
0b40: 20 62 75 66 66 65 72 20 2b 20 6c 69 6e 65 62 75   buffer + linebu
0b50: 66 66 65 72 2d 3e 73 69 7a 65 20 2d 20 31 3b 0a  ffer->size - 1;.
0b60: 09 7d 0a 20 20 20 20 20 20 2a 70 2b 2b 20 3d 20  .}.      *p++ = 
0b70: 63 3b 0a 20 20 20 20 7d 0a 20 20 77 68 69 6c 65  c;.    }.  while
0b80: 20 28 63 20 21 3d 20 27 5c 6e 27 29 3b 0a 0a 20   (c != '\n');.. 
0b90: 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 6c 65 6e   linebuffer->len
0ba0: 67 74 68 20 3d 20 70 20 2d 20 62 75 66 66 65 72  gth = p - buffer
0bb0: 3b 0a 20 20 72 65 74 75 72 6e 20 6c 69 6e 65 62  ;.  return lineb
0bc0: 75 66 66 65 72 3b 0a 7d 0a 0a 2f 2a 20 46 72 65  uffer;.}../* Fre
0bd0: 65 20 6c 69 6e 65 62 75 66 66 65 72 20 4c 49 4e  e linebuffer LIN
0be0: 45 42 55 46 46 45 52 27 73 20 64 61 74 61 2e 20  EBUFFER's data. 
0bf0: 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69 64 0a  */..static void.
0c00: 66 72 65 65 62 75 66 66 65 72 20 28 73 74 72 75  freebuffer (stru
0c10: 63 74 20 6c 69 6e 65 62 75 66 66 65 72 20 2a 6c  ct linebuffer *l
0c20: 69 6e 65 62 75 66 66 65 72 29 0a 7b 0a 20 20 66  inebuffer).{.  f
0c30: 72 65 65 20 28 6c 69 6e 65 62 75 66 66 65 72 2d  ree (linebuffer-
0c40: 3e 62 75 66 66 65 72 29 3b 0a 7d 0a 0a 2f 2a 20  >buffer);.}../* 
0c50: 55 6e 64 65 66 69 6e 65 2c 20 74 6f 20 61 76 6f  Undefine, to avo
0c60: 69 64 20 77 61 72 6e 69 6e 67 20 61 62 6f 75 74  id warning about
0c70: 20 72 65 64 65 66 69 6e 69 74 69 6f 6e 20 6f 6e   redefinition on
0c80: 20 73 6f 6d 65 20 73 79 73 74 65 6d 73 2e 20 20   some systems.  
0c90: 2a 2f 0a 23 75 6e 64 65 66 20 6d 69 6e 0a 23 64  */.#undef min.#d
0ca0: 65 66 69 6e 65 20 6d 69 6e 28 78 2c 20 79 29 20  efine min(x, y) 
0cb0: 28 28 78 29 20 3c 20 28 79 29 20 3f 20 28 78 29  ((x) < (y) ? (x)
0cc0: 20 3a 20 28 79 29 29 0a 0a 2f 2a 20 52 65 74 75   : (y))../* Retu
0cd0: 72 6e 20 7a 65 72 6f 20 69 66 20 74 77 6f 20 73  rn zero if two s
0ce0: 74 72 69 6e 67 73 20 4f 4c 44 20 61 6e 64 20 4e  trings OLD and N
0cf0: 45 57 20 6d 61 74 63 68 2c 20 6e 6f 6e 7a 65 72  EW match, nonzer
0d00: 6f 20 69 66 20 6e 6f 74 2e 0a 20 20 20 4f 4c 44  o if not..   OLD
0d10: 20 61 6e 64 20 4e 45 57 20 70 6f 69 6e 74 20 6e   and NEW point n
0d20: 6f 74 20 74 6f 20 74 68 65 20 62 65 67 69 6e 6e  ot to the beginn
0d30: 69 6e 67 73 20 6f 66 20 74 68 65 20 6c 69 6e 65  ings of the line
0d40: 73 0a 20 20 20 62 75 74 20 72 61 74 68 65 72 20  s.   but rather 
0d50: 74 6f 20 74 68 65 20 62 65 67 69 6e 6e 69 6e 67  to the beginning
0d60: 73 20 6f 66 20 74 68 65 20 66 69 65 6c 64 73 20  s of the fields 
0d70: 74 6f 20 63 6f 6d 70 61 72 65 2e 0a 20 20 20 4f  to compare..   O
0d80: 4c 44 4c 45 4e 20 61 6e 64 20 4e 45 57 4c 45 4e  LDLEN and NEWLEN
0d90: 20 61 72 65 20 74 68 65 69 72 20 6c 65 6e 67 74   are their lengt
0da0: 68 73 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 69  hs. */..static i
0db0: 6e 74 0a 64 69 66 66 65 72 65 6e 74 20 28 63 6f  nt.different (co
0dc0: 6e 73 74 20 63 68 61 72 20 2a 6f 6c 64 2c 20 63  nst char *old, c
0dd0: 6f 6e 73 74 20 63 68 61 72 20 2a 6e 65 77 2c 20  onst char *new, 
0de0: 73 69 7a 65 5f 74 20 6f 6c 64 6c 65 6e 2c 20 73  size_t oldlen, s
0df0: 69 7a 65 5f 74 20 6e 65 77 6c 65 6e 29 0a 7b 0a  ize_t newlen).{.
0e00: 20 20 69 6e 74 20 6f 72 64 65 72 3b 0a 0a 20 20    int order;..  
0e10: 6f 72 64 65 72 20 3d 20 6d 65 6d 63 6d 70 20 28  order = memcmp (
0e20: 6f 6c 64 2c 20 6e 65 77 2c 20 6d 69 6e 20 28 6f  old, new, min (o
0e30: 6c 64 6c 65 6e 2c 20 6e 65 77 6c 65 6e 29 29 3b  ldlen, newlen));
0e40: 0a 0a 20 20 69 66 20 28 6f 72 64 65 72 20 3d 3d  ..  if (order ==
0e50: 20 30 29 0a 20 20 20 20 72 65 74 75 72 6e 20 6f   0).    return o
0e60: 6c 64 6c 65 6e 20 2d 20 6e 65 77 6c 65 6e 3b 0a  ldlen - newlen;.
0e70: 20 20 72 65 74 75 72 6e 20 6f 72 64 65 72 3b 0a    return order;.
0e80: 7d 0a 0a 2f 2a 20 4f 75 74 70 75 74 20 74 68 65  }../* Output the
0e90: 20 6c 69 6e 65 20 69 6e 20 6c 69 6e 65 62 75 66   line in linebuf
0ea0: 66 65 72 20 4c 49 4e 45 20 74 6f 20 73 74 72 65  fer LINE to stre
0eb0: 61 6d 20 53 54 52 45 41 4d 0a 20 20 20 70 72 6f  am STREAM.   pro
0ec0: 76 69 64 65 64 20 74 68 61 74 20 74 68 65 20 73  vided that the s
0ed0: 77 69 74 63 68 65 73 20 73 61 79 20 69 74 20 73  witches say it s
0ee0: 68 6f 75 6c 64 20 62 65 20 6f 75 74 70 75 74 2e  hould be output.
0ef0: 0a 20 20 20 49 66 20 72 65 71 75 65 73 74 65 64  .   If requested
0f00: 2c 20 70 72 69 6e 74 20 74 68 65 20 6e 75 6d 62  , print the numb
0f10: 65 72 20 6f 66 20 74 69 6d 65 73 20 69 74 20 6f  er of times it o
0f20: 63 63 75 72 72 65 64 2c 20 61 73 20 77 65 6c 6c  ccurred, as well
0f30: 3b 0a 20 20 20 4c 49 4e 45 43 4f 55 4e 54 20 2b  ;.   LINECOUNT +
0f40: 20 31 20 69 73 20 74 68 65 20 6e 75 6d 62 65 72   1 is the number
0f50: 20 6f 66 20 74 69 6d 65 73 20 74 68 61 74 20 74   of times that t
0f60: 68 65 20 6c 69 6e 65 20 6f 63 63 75 72 72 65 64  he line occurred
0f70: 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69  . */..static voi
0f80: 64 0a 77 72 69 74 65 6c 69 6e 65 20 28 63 6f 6e  d.writeline (con
0f90: 73 74 20 73 74 72 75 63 74 20 6c 69 6e 65 62 75  st struct linebu
0fa0: 66 66 65 72 20 2a 6c 69 6e 65 2c 20 46 49 4c 45  ffer *line, FILE
0fb0: 20 2a 73 74 72 65 61 6d 2c 20 69 6e 74 20 6c 69   *stream, int li
0fc0: 6e 65 63 6f 75 6e 74 29 0a 7b 0a 20 20 69 66 20  necount).{.  if 
0fd0: 28 6c 69 6e 65 63 6f 75 6e 74 20 3d 3d 20 30 29  (linecount == 0)
0fe0: 0a 20 20 20 20 66 77 72 69 74 65 20 28 6c 69 6e  .    fwrite (lin
0ff0: 65 2d 3e 62 75 66 66 65 72 2c 20 31 2c 20 6c 69  e->buffer, 1, li
1000: 6e 65 2d 3e 6c 65 6e 67 74 68 2c 20 73 74 72 65  ne->length, stre
1010: 61 6d 29 3b 0a 7d 0a 0a 2f 2a 20 50 72 6f 63 65  am);.}../* Proce
1020: 73 73 20 69 6e 70 75 74 20 66 69 6c 65 20 49 4e  ss input file IN
1030: 46 49 4c 45 20 77 69 74 68 20 6f 75 74 70 75 74  FILE with output
1040: 20 74 6f 20 4f 55 54 46 49 4c 45 2e 0a 20 20 20   to OUTFILE..   
1050: 49 66 20 65 69 74 68 65 72 20 69 73 20 22 2d 22  If either is "-"
1060: 2c 20 75 73 65 20 74 68 65 20 73 74 61 6e 64 61  , use the standa
1070: 72 64 20 49 2f 4f 20 73 74 72 65 61 6d 20 66 6f  rd I/O stream fo
1080: 72 20 69 74 20 69 6e 73 74 65 61 64 2e 20 2a 2f  r it instead. */
1090: 0a 0a 73 74 61 74 69 63 20 76 6f 69 64 0a 63 68  ..static void.ch
10a0: 65 63 6b 5f 66 69 6c 65 20 28 63 6f 6e 73 74 20  eck_file (const 
10b0: 63 68 61 72 20 2a 69 6e 66 69 6c 65 2c 20 63 6f  char *infile, co
10c0: 6e 73 74 20 63 68 61 72 20 2a 6f 75 74 66 69 6c  nst char *outfil
10d0: 65 29 0a 7b 0a 20 20 46 49 4c 45 20 2a 69 73 74  e).{.  FILE *ist
10e0: 72 65 61 6d 3b 0a 20 20 46 49 4c 45 20 2a 6f 73  ream;.  FILE *os
10f0: 74 72 65 61 6d 3b 0a 20 20 73 74 72 75 63 74 20  tream;.  struct 
1100: 6c 69 6e 65 62 75 66 66 65 72 20 6c 62 31 2c 20  linebuffer lb1, 
1110: 6c 62 32 3b 0a 20 20 73 74 72 75 63 74 20 6c 69  lb2;.  struct li
1120: 6e 65 62 75 66 66 65 72 20 2a 74 68 69 73 6c 69  nebuffer *thisli
1130: 6e 65 2c 20 2a 70 72 65 76 6c 69 6e 65 2c 20 2a  ne, *prevline, *
1140: 65 78 63 68 3b 0a 20 20 63 68 61 72 20 2a 70 72  exch;.  char *pr
1150: 65 76 66 69 65 6c 64 2c 20 2a 74 68 69 73 66 69  evfield, *thisfi
1160: 65 6c 64 3b 0a 20 20 73 69 7a 65 5f 74 20 70 72  eld;.  size_t pr
1170: 65 76 6c 65 6e 2c 20 74 68 69 73 6c 65 6e 3b 0a  evlen, thislen;.
1180: 20 20 69 6e 74 20 6d 61 74 63 68 5f 63 6f 75 6e    int match_coun
1190: 74 20 3d 20 30 3b 0a 0a 20 20 69 66 20 28 21 73  t = 0;..  if (!s
11a0: 74 72 63 6d 70 20 28 69 6e 66 69 6c 65 2c 20 22  trcmp (infile, "
11b0: 2d 22 29 29 0a 20 20 20 20 69 73 74 72 65 61 6d  -")).    istream
11c0: 20 3d 20 73 74 64 69 6e 3b 0a 20 20 65 6c 73 65   = stdin;.  else
11d0: 0a 20 20 20 20 69 73 74 72 65 61 6d 20 3d 20 66  .    istream = f
11e0: 6f 70 65 6e 20 28 69 6e 66 69 6c 65 2c 20 22 72  open (infile, "r
11f0: 22 29 3b 0a 20 20 69 66 20 28 69 73 74 72 65 61  ");.  if (istrea
1200: 6d 20 3d 3d 20 4e 55 4c 4c 29 0a 20 20 20 20 7b  m == NULL).    {
1210: 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28  .      fprintf (
1220: 73 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72  stderr, "%s: err
1230: 6f 72 20 6f 70 65 6e 69 6e 67 20 25 73 5c 6e 22  or opening %s\n"
1240: 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20  , program_name, 
1250: 69 6e 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65  infile);.      e
1260: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a  xit (1);.    }..
1270: 20 20 69 66 20 28 21 73 74 72 63 6d 70 20 28 6f    if (!strcmp (o
1280: 75 74 66 69 6c 65 2c 20 22 2d 22 29 29 0a 20 20  utfile, "-")).  
1290: 20 20 6f 73 74 72 65 61 6d 20 3d 20 73 74 64 6f    ostream = stdo
12a0: 75 74 3b 0a 20 20 65 6c 73 65 0a 20 20 20 20 6f  ut;.  else.    o
12b0: 73 74 72 65 61 6d 20 3d 20 66 6f 70 65 6e 20 28  stream = fopen (
12c0: 6f 75 74 66 69 6c 65 2c 20 22 77 22 29 3b 0a 20  outfile, "w");. 
12d0: 20 69 66 20 28 6f 73 74 72 65 61 6d 20 3d 3d 20   if (ostream == 
12e0: 4e 55 4c 4c 29 0a 20 20 20 20 7b 0a 20 20 20 20  NULL).    {.    
12f0: 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 65 72    fprintf (stder
1300: 72 2c 20 22 25 73 3a 20 65 72 72 6f 72 20 6f 70  r, "%s: error op
1310: 65 6e 69 6e 67 20 25 73 5c 6e 22 2c 20 70 72 6f  ening %s\n", pro
1320: 67 72 61 6d 5f 6e 61 6d 65 2c 20 6f 75 74 66 69  gram_name, outfi
1330: 6c 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20  le);.      exit 
1340: 28 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 74 68  (1);.    }..  th
1350: 69 73 6c 69 6e 65 20 3d 20 26 6c 62 31 3b 0a 20  isline = &lb1;. 
1360: 20 70 72 65 76 6c 69 6e 65 20 3d 20 26 6c 62 32   prevline = &lb2
1370: 3b 0a 0a 20 20 69 6e 69 74 62 75 66 66 65 72 20  ;..  initbuffer 
1380: 28 74 68 69 73 6c 69 6e 65 29 3b 0a 20 20 69 6e  (thisline);.  in
1390: 69 74 62 75 66 66 65 72 20 28 70 72 65 76 6c 69  itbuffer (prevli
13a0: 6e 65 29 3b 0a 0a 20 20 69 66 20 28 72 65 61 64  ne);..  if (read
13b0: 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e 65 2c 20  line (prevline, 
13c0: 69 73 74 72 65 61 6d 29 20 3d 3d 20 30 29 0a 20  istream) == 0). 
13d0: 20 20 20 67 6f 74 6f 20 63 6c 6f 73 65 66 69 6c     goto closefil
13e0: 65 73 3b 0a 20 20 70 72 65 76 66 69 65 6c 64 20  es;.  prevfield 
13f0: 3d 20 70 72 65 76 6c 69 6e 65 2d 3e 62 75 66 66  = prevline->buff
1400: 65 72 3b 0a 20 20 70 72 65 76 6c 65 6e 20 3d 20  er;.  prevlen = 
1410: 70 72 65 76 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68  prevline->length
1420: 3b 0a 0a 20 20 77 68 69 6c 65 20 28 21 66 65 6f  ;..  while (!feo
1430: 66 20 28 69 73 74 72 65 61 6d 29 29 0a 20 20 20  f (istream)).   
1440: 20 7b 0a 20 20 20 20 20 20 69 6e 74 20 6d 61 74   {.      int mat
1450: 63 68 3b 0a 20 20 20 20 20 20 69 66 20 28 72 65  ch;.      if (re
1460: 61 64 6c 69 6e 65 20 28 74 68 69 73 6c 69 6e 65  adline (thisline
1470: 2c 20 69 73 74 72 65 61 6d 29 20 3d 3d 20 30 29  , istream) == 0)
1480: 0a 09 62 72 65 61 6b 3b 0a 20 20 20 20 20 20 74  ..break;.      t
1490: 68 69 73 66 69 65 6c 64 20 3d 20 74 68 69 73 6c  hisfield = thisl
14a0: 69 6e 65 2d 3e 62 75 66 66 65 72 3b 0a 20 20 20  ine->buffer;.   
14b0: 20 20 20 74 68 69 73 6c 65 6e 20 3d 20 74 68 69     thislen = thi
14c0: 73 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68 3b 0a 20  sline->length;. 
14d0: 20 20 20 20 20 6d 61 74 63 68 20 3d 20 21 64 69       match = !di
14e0: 66 66 65 72 65 6e 74 20 28 74 68 69 73 66 69 65  fferent (thisfie
14f0: 6c 64 2c 20 70 72 65 76 66 69 65 6c 64 2c 20 74  ld, prevfield, t
1500: 68 69 73 6c 65 6e 2c 20 70 72 65 76 6c 65 6e 29  hislen, prevlen)
1510: 3b 0a 0a 20 20 20 20 20 20 69 66 20 28 6d 61 74  ;..      if (mat
1520: 63 68 29 0a 09 2b 2b 6d 61 74 63 68 5f 63 6f 75  ch)..++match_cou
1530: 6e 74 3b 0a 0a 20 20 20 20 20 20 69 66 20 28 21  nt;..      if (!
1540: 6d 61 74 63 68 29 0a 09 7b 0a 09 20 20 77 72 69  match)..{..  wri
1550: 74 65 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e 65  teline (prevline
1560: 2c 20 6f 73 74 72 65 61 6d 2c 20 6d 61 74 63 68  , ostream, match
1570: 5f 63 6f 75 6e 74 29 3b 0a 09 20 20 65 78 63 68  _count);..  exch
1580: 20 3d 20 70 72 65 76 6c 69 6e 65 3b 0a 09 20 20   = prevline;..  
1590: 70 72 65 76 6c 69 6e 65 20 3d 20 74 68 69 73 6c  prevline = thisl
15a0: 69 6e 65 3b 0a 09 20 20 74 68 69 73 6c 69 6e 65  ine;..  thisline
15b0: 20 3d 20 65 78 63 68 3b 0a 09 20 20 70 72 65 76   = exch;..  prev
15c0: 66 69 65 6c 64 20 3d 20 74 68 69 73 66 69 65 6c  field = thisfiel
15d0: 64 3b 0a 09 20 20 70 72 65 76 6c 65 6e 20 3d 20  d;..  prevlen = 
15e0: 74 68 69 73 6c 65 6e 3b 0a 09 20 20 69 66 20 28  thislen;..  if (
15f0: 21 6d 61 74 63 68 29 0a 09 20 20 20 20 6d 61 74  !match)..    mat
1600: 63 68 5f 63 6f 75 6e 74 20 3d 20 30 3b 0a 09 7d  ch_count = 0;..}
1610: 0a 20 20 20 20 7d 0a 0a 20 20 77 72 69 74 65 6c  .    }..  writel
1620: 69 6e 65 20 28 70 72 65 76 6c 69 6e 65 2c 20 6f  ine (prevline, o
1630: 73 74 72 65 61 6d 2c 20 6d 61 74 63 68 5f 63 6f  stream, match_co
1640: 75 6e 74 29 3b 0a 0a 20 63 6c 6f 73 65 66 69 6c  unt);.. closefil
1650: 65 73 3a 0a 20 20 69 66 20 28 66 65 72 72 6f 72  es:.  if (ferror
1660: 20 28 69 73 74 72 65 61 6d 29 20 7c 7c 20 66 63   (istream) || fc
1670: 6c 6f 73 65 20 28 69 73 74 72 65 61 6d 29 20 3d  lose (istream) =
1680: 3d 20 45 4f 46 29 0a 20 20 20 20 7b 0a 20 20 20  = EOF).    {.   
1690: 20 20 20 66 70 72 69 6e 74 66 20 28 73 74 64 65     fprintf (stde
16a0: 72 72 2c 20 22 25 73 3a 20 65 72 72 6f 72 20 72  rr, "%s: error r
16b0: 65 61 64 69 6e 67 20 25 73 5c 6e 22 2c 20 70 72  eading %s\n", pr
16c0: 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 69 6e 66 69  ogram_name, infi
16d0: 6c 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20  le);.      exit 
16e0: 28 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 69 66  (1);.    }..  if
16f0: 20 28 66 65 72 72 6f 72 20 28 6f 73 74 72 65 61   (ferror (ostrea
1700: 6d 29 20 7c 7c 20 66 63 6c 6f 73 65 20 28 6f 73  m) || fclose (os
1710: 74 72 65 61 6d 29 20 3d 3d 20 45 4f 46 29 0a 20  tream) == EOF). 
1720: 20 20 20 7b 0a 20 20 20 20 20 20 66 70 72 69 6e     {.      fprin
1730: 74 66 20 28 73 74 64 65 72 72 2c 20 22 25 73 3a  tf (stderr, "%s:
1740: 20 65 72 72 6f 72 20 77 72 69 74 69 6e 67 20 25   error writing %
1750: 73 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61  s\n", program_na
1760: 6d 65 2c 20 6f 75 74 66 69 6c 65 29 3b 0a 20 20  me, outfile);.  
1770: 20 20 20 20 65 78 69 74 20 28 31 29 3b 0a 20 20      exit (1);.  
1780: 20 20 7d 0a 0a 20 20 66 72 65 65 62 75 66 66 65    }..  freebuffe
1790: 72 20 28 26 6c 62 31 29 3b 0a 20 20 66 72 65 65  r (&lb1);.  free
17a0: 62 75 66 66 65 72 20 28 26 6c 62 32 29 3b 0a 7d  buffer (&lb2);.}
17b0: 0a 0a 69 6e 74 0a 6d 61 69 6e 20 28 69 6e 74 20  ..int.main (int 
17c0: 61 72 67 63 2c 20 63 68 61 72 20 2a 2a 61 72 67  argc, char **arg
17d0: 76 29 0a 7b 0a 20 20 63 6f 6e 73 74 20 63 68 61  v).{.  const cha
17e0: 72 20 2a 69 6e 66 69 6c 65 20 3d 20 22 2d 22 3b  r *infile = "-";
17f0: 0a 20 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f  .  const char *o
1800: 75 74 66 69 6c 65 20 3d 20 22 2d 22 3b 0a 20 20  utfile = "-";.  
1810: 69 6e 74 20 6f 70 74 69 6e 64 20 3d 20 31 3b 0a  int optind = 1;.
1820: 0a 20 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 20  .  program_name 
1830: 3d 20 61 72 67 76 5b 30 5d 3b 0a 0a 20 20 69 66  = argv[0];..  if
1840: 20 28 6f 70 74 69 6e 64 20 3c 20 61 72 67 63 29   (optind < argc)
1850: 0a 20 20 20 20 69 6e 66 69 6c 65 20 3d 20 61 72  .    infile = ar
1860: 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d 3b 0a 0a 20  gv[optind++];.. 
1870: 20 69 66 20 28 6f 70 74 69 6e 64 20 3c 20 61 72   if (optind < ar
1880: 67 63 29 0a 20 20 20 20 6f 75 74 66 69 6c 65 20  gc).    outfile 
1890: 3d 20 61 72 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d  = argv[optind++]
18a0: 3b 0a 0a 20 20 69 66 20 28 6f 70 74 69 6e 64 20  ;..  if (optind 
18b0: 3c 20 61 72 67 63 29 0a 20 20 20 20 7b 0a 20 20  < argc).    {.  
18c0: 20 20 20 20 66 70 72 69 6e 74 66 20 28 73 74 64      fprintf (std
18d0: 65 72 72 2c 20 22 25 73 3a 20 74 6f 6f 20 6d 61  err, "%s: too ma
18e0: 6e 79 20 61 72 67 75 6d 65 6e 74 73 5c 6e 22 2c  ny arguments\n",
18f0: 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 29 3b 0a   program_name);.
1900: 20 20 20 20 20 20 65 78 69 74 20 28 31 29 3b 0a        exit (1);.
1910: 20 20 20 20 7d 0a 0a 20 20 63 68 65 63 6b 5f 66      }..  check_f
1920: 69 6c 65 20 28 69 6e 66 69 6c 65 2c 20 6f 75 74  ile (infile, out
1930: 66 69 6c 65 29 3b 0a 0a 20 20 65 78 69 74 20 28  file);..  exit (
1940: 30 29 3b 0a 7d 0a                                0);.}.