Artifact 05b2098f446694db32d1abaf759639191dd57993:


0000: 2f 2a 20 75 6e 69 71 20 2d 2d 20 72 65 6d 6f 76  /* uniq -- remov
0010: 65 20 64 75 70 6c 69 63 61 74 65 20 6c 69 6e 65  e duplicate line
0020: 73 20 66 72 6f 6d 20 61 20 73 6f 72 74 65 64 20  s from a sorted 
0030: 66 69 6c 65 0a 20 20 20 43 6f 70 79 72 69 67 68  file.   Copyrigh
0040: 74 20 28 43 29 20 38 36 2c 20 39 31 2c 20 31 39  t (C) 86, 91, 19
0050: 39 35 2d 31 39 39 38 2c 20 31 39 39 39 20 46 72  95-1998, 1999 Fr
0060: 65 65 20 53 6f 66 74 77 61 72 65 20 46 6f 75 6e  ee Software Foun
0070: 64 61 74 69 6f 6e 2c 20 49 6e 63 2e 0a 0a 20 20  dation, Inc...  
0080: 20 54 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73   This program is
0090: 20 66 72 65 65 20 73 6f 66 74 77 61 72 65 3b 20   free software; 
00a0: 79 6f 75 20 63 61 6e 20 72 65 64 69 73 74 72 69  you can redistri
00b0: 62 75 74 65 20 69 74 20 61 6e 64 2f 6f 72 20 6d  bute it and/or m
00c0: 6f 64 69 66 79 0a 20 20 20 69 74 20 75 6e 64 65  odify.   it unde
00d0: 72 20 74 68 65 20 74 65 72 6d 73 20 6f 66 20 74  r the terms of t
00e0: 68 65 20 47 4e 55 20 47 65 6e 65 72 61 6c 20 50  he GNU General P
00f0: 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20 61 73  ublic License as
0100: 20 70 75 62 6c 69 73 68 65 64 20 62 79 0a 20 20   published by.  
0110: 20 74 68 65 20 46 72 65 65 20 53 6f 66 74 77 61   the Free Softwa
0120: 72 65 20 46 6f 75 6e 64 61 74 69 6f 6e 3b 20 65  re Foundation; e
0130: 69 74 68 65 72 20 76 65 72 73 69 6f 6e 20 32 2c  ither version 2,
0140: 20 6f 72 20 28 61 74 20 79 6f 75 72 20 6f 70 74   or (at your opt
0150: 69 6f 6e 29 0a 20 20 20 61 6e 79 20 6c 61 74 65  ion).   any late
0160: 72 20 76 65 72 73 69 6f 6e 2e 0a 0a 20 20 20 54  r version...   T
0170: 68 69 73 20 70 72 6f 67 72 61 6d 20 69 73 20 64  his program is d
0180: 69 73 74 72 69 62 75 74 65 64 20 69 6e 20 74 68  istributed in th
0190: 65 20 68 6f 70 65 20 74 68 61 74 20 69 74 20 77  e hope that it w
01a0: 69 6c 6c 20 62 65 20 75 73 65 66 75 6c 2c 0a 20  ill be useful,. 
01b0: 20 20 62 75 74 20 57 49 54 48 4f 55 54 20 41 4e    but WITHOUT AN
01c0: 59 20 57 41 52 52 41 4e 54 59 3b 20 77 69 74 68  Y WARRANTY; with
01d0: 6f 75 74 20 65 76 65 6e 20 74 68 65 20 69 6d 70  out even the imp
01e0: 6c 69 65 64 20 77 61 72 72 61 6e 74 79 20 6f 66  lied warranty of
01f0: 0a 20 20 20 4d 45 52 43 48 41 4e 54 41 42 49 4c  .   MERCHANTABIL
0200: 49 54 59 20 6f 72 20 46 49 54 4e 45 53 53 20 46  ITY or FITNESS F
0210: 4f 52 20 41 20 50 41 52 54 49 43 55 4c 41 52 20  OR A PARTICULAR 
0220: 50 55 52 50 4f 53 45 2e 20 20 53 65 65 20 74 68  PURPOSE.  See th
0230: 65 0a 20 20 20 47 4e 55 20 47 65 6e 65 72 61 6c  e.   GNU General
0240: 20 50 75 62 6c 69 63 20 4c 69 63 65 6e 73 65 20   Public License 
0250: 66 6f 72 20 6d 6f 72 65 20 64 65 74 61 69 6c 73  for more details
0260: 2e 0a 0a 20 20 20 59 6f 75 20 73 68 6f 75 6c 64  ...   You should
0270: 20 68 61 76 65 20 72 65 63 65 69 76 65 64 20 61   have received a
0280: 20 63 6f 70 79 20 6f 66 20 74 68 65 20 47 4e 55   copy of the GNU
0290: 20 47 65 6e 65 72 61 6c 20 50 75 62 6c 69 63 20   General Public 
02a0: 4c 69 63 65 6e 73 65 0a 20 20 20 61 6c 6f 6e 67  License.   along
02b0: 20 77 69 74 68 20 74 68 69 73 20 70 72 6f 67 72   with this progr
02c0: 61 6d 3b 20 69 66 20 6e 6f 74 2c 20 77 72 69 74  am; if not, writ
02d0: 65 20 74 6f 20 74 68 65 20 46 72 65 65 20 53 6f  e to the Free So
02e0: 66 74 77 61 72 65 20 46 6f 75 6e 64 61 74 69 6f  ftware Foundatio
02f0: 6e 2c 0a 20 20 20 49 6e 63 2e 2c 20 35 31 20 46  n,.   Inc., 51 F
0300: 72 61 6e 6b 6c 69 6e 20 53 74 72 65 65 74 2c 20  ranklin Street, 
0310: 46 69 66 74 68 20 46 6c 6f 6f 72 2c 20 42 6f 73  Fifth Floor, Bos
0320: 74 6f 6e 2c 20 4d 41 20 30 32 31 31 30 2d 31 33  ton, MA 02110-13
0330: 30 31 2c 20 55 53 41 2e 20 20 2a 2f 0a 0a 2f 2a  01, USA.  */../*
0340: 20 57 72 69 74 74 65 6e 20 62 79 20 52 69 63 68   Written by Rich
0350: 61 72 64 20 53 74 61 6c 6c 6d 61 6e 20 61 6e 64  ard Stallman and
0360: 20 44 61 76 69 64 20 4d 61 63 4b 65 6e 7a 69 65   David MacKenzie
0370: 2e 20 2a 2f 0a 2f 2a 20 32 30 30 30 2d 30 33 2d  . */./* 2000-03-
0380: 32 32 20 20 54 72 69 6d 6d 65 64 20 64 6f 77 6e  22  Trimmed down
0390: 20 74 6f 20 74 68 65 20 63 61 73 65 20 6f 66 20   to the case of 
03a0: 22 75 6e 69 71 20 2d 75 22 20 62 79 20 42 72 75  "uniq -u" by Bru
03b0: 6e 6f 20 48 61 69 62 6c 65 2e 20 2a 2f 0a 0a 23  no Haible. */..#
03c0: 69 6e 63 6c 75 64 65 20 3c 73 74 64 64 65 66 2e  include <stddef.
03d0: 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c 73 74 64  h>.#include <std
03e0: 69 6f 2e 68 3e 0a 23 69 6e 63 6c 75 64 65 20 3c  io.h>.#include <
03f0: 73 74 64 6c 69 62 2e 68 3e 0a 23 69 6e 63 6c 75  stdlib.h>.#inclu
0400: 64 65 20 3c 73 74 72 69 6e 67 2e 68 3e 0a 0a 2f  de <string.h>../
0410: 2a 20 54 68 65 20 6e 61 6d 65 20 74 68 69 73 20  * The name this 
0420: 70 72 6f 67 72 61 6d 20 77 61 73 20 72 75 6e 20  program was run 
0430: 77 69 74 68 2e 20 2a 2f 0a 73 74 61 74 69 63 20  with. */.static 
0440: 63 68 61 72 20 2a 70 72 6f 67 72 61 6d 5f 6e 61  char *program_na
0450: 6d 65 3b 0a 0a 73 74 61 74 69 63 20 76 6f 69 64  me;..static void
0460: 0a 78 61 6c 6c 6f 63 5f 66 61 69 6c 20 28 76 6f  .xalloc_fail (vo
0470: 69 64 29 0a 7b 0a 20 20 66 70 72 69 6e 74 66 20  id).{.  fprintf 
0480: 28 73 74 64 65 72 72 2c 20 22 25 73 3a 20 76 69  (stderr, "%s: vi
0490: 72 74 75 61 6c 20 6d 65 6d 6f 72 79 20 65 78 68  rtual memory exh
04a0: 61 75 73 74 65 64 5c 6e 22 2c 20 70 72 6f 67 72  austed\n", progr
04b0: 61 6d 5f 6e 61 6d 65 29 3b 0a 20 20 65 78 69 74  am_name);.  exit
04c0: 20 28 31 29 3b 0a 7d 0a 0a 2f 2a 20 41 6c 6c 6f   (1);.}../* Allo
04d0: 63 61 74 65 20 4e 20 62 79 74 65 73 20 6f 66 20  cate N bytes of 
04e0: 6d 65 6d 6f 72 79 20 64 79 6e 61 6d 69 63 61 6c  memory dynamical
04f0: 6c 79 2c 20 77 69 74 68 20 65 72 72 6f 72 20 63  ly, with error c
0500: 68 65 63 6b 69 6e 67 2e 20 20 2a 2f 0a 0a 76 6f  hecking.  */..vo
0510: 69 64 20 2a 0a 78 6d 61 6c 6c 6f 63 20 28 73 69  id *.xmalloc (si
0520: 7a 65 5f 74 20 6e 29 0a 7b 0a 20 20 76 6f 69 64  ze_t n).{.  void
0530: 20 2a 70 3b 0a 0a 20 20 70 20 3d 20 6d 61 6c 6c   *p;..  p = mall
0540: 6f 63 20 28 6e 29 3b 0a 20 20 69 66 20 28 70 20  oc (n);.  if (p 
0550: 3d 3d 20 30 29 0a 20 20 20 20 78 61 6c 6c 6f 63  == 0).    xalloc
0560: 5f 66 61 69 6c 20 28 29 3b 0a 20 20 72 65 74 75  _fail ();.  retu
0570: 72 6e 20 70 3b 0a 7d 0a 0a 2f 2a 20 43 68 61 6e  rn p;.}../* Chan
0580: 67 65 20 74 68 65 20 73 69 7a 65 20 6f 66 20 61  ge the size of a
0590: 6e 20 61 6c 6c 6f 63 61 74 65 64 20 62 6c 6f 63  n allocated bloc
05a0: 6b 20 6f 66 20 6d 65 6d 6f 72 79 20 50 20 74 6f  k of memory P to
05b0: 20 4e 20 62 79 74 65 73 2c 0a 20 20 20 77 69 74   N bytes,.   wit
05c0: 68 20 65 72 72 6f 72 20 63 68 65 63 6b 69 6e 67  h error checking
05d0: 2e 0a 20 20 20 49 66 20 50 20 69 73 20 4e 55 4c  ..   If P is NUL
05e0: 4c 2c 20 72 75 6e 20 78 6d 61 6c 6c 6f 63 2e 20  L, run xmalloc. 
05f0: 20 2a 2f 0a 0a 76 6f 69 64 20 2a 0a 78 72 65 61   */..void *.xrea
0600: 6c 6c 6f 63 20 28 76 6f 69 64 20 2a 70 2c 20 73  lloc (void *p, s
0610: 69 7a 65 5f 74 20 6e 29 0a 7b 0a 20 20 70 20 3d  ize_t n).{.  p =
0620: 20 72 65 61 6c 6c 6f 63 20 28 70 2c 20 6e 29 3b   realloc (p, n);
0630: 0a 20 20 69 66 20 28 70 20 3d 3d 20 30 29 0a 20  .  if (p == 0). 
0640: 20 20 20 78 61 6c 6c 6f 63 5f 66 61 69 6c 20 28     xalloc_fail (
0650: 29 3b 0a 20 20 72 65 74 75 72 6e 20 70 3b 0a 7d  );.  return p;.}
0660: 0a 0a 2f 2a 20 41 20 60 73 74 72 75 63 74 20 6c  ../* A `struct l
0670: 69 6e 65 62 75 66 66 65 72 27 20 68 6f 6c 64 73  inebuffer' holds
0680: 20 61 20 6c 69 6e 65 20 6f 66 20 74 65 78 74 2e   a line of text.
0690: 20 2a 2f 0a 0a 73 74 72 75 63 74 20 6c 69 6e 65   */..struct line
06a0: 62 75 66 66 65 72 0a 7b 0a 20 20 73 69 7a 65 5f  buffer.{.  size_
06b0: 74 20 73 69 7a 65 3b 09 09 09 2f 2a 20 41 6c 6c  t size;.../* All
06c0: 6f 63 61 74 65 64 2e 20 2a 2f 0a 20 20 73 69 7a  ocated. */.  siz
06d0: 65 5f 74 20 6c 65 6e 67 74 68 3b 09 09 2f 2a 20  e_t length;../* 
06e0: 55 73 65 64 2e 20 2a 2f 0a 20 20 63 68 61 72 20  Used. */.  char 
06f0: 2a 62 75 66 66 65 72 3b 0a 7d 3b 0a 0a 2f 2a 20  *buffer;.};../* 
0700: 49 6e 69 74 69 61 6c 69 7a 65 20 6c 69 6e 65 62  Initialize lineb
0710: 75 66 66 65 72 20 4c 49 4e 45 42 55 46 46 45 52  uffer LINEBUFFER
0720: 20 66 6f 72 20 75 73 65 2e 20 2a 2f 0a 0a 73 74   for use. */..st
0730: 61 74 69 63 20 76 6f 69 64 0a 69 6e 69 74 62 75  atic void.initbu
0740: 66 66 65 72 20 28 73 74 72 75 63 74 20 6c 69 6e  ffer (struct lin
0750: 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 62 75 66  ebuffer *linebuf
0760: 66 65 72 29 0a 7b 0a 20 20 6c 69 6e 65 62 75 66  fer).{.  linebuf
0770: 66 65 72 2d 3e 6c 65 6e 67 74 68 20 3d 20 30 3b  fer->length = 0;
0780: 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73  .  linebuffer->s
0790: 69 7a 65 20 3d 20 32 30 30 3b 0a 20 20 6c 69 6e  ize = 200;.  lin
07a0: 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65 72 20  ebuffer->buffer 
07b0: 3d 20 28 63 68 61 72 20 2a 29 20 78 6d 61 6c 6c  = (char *) xmall
07c0: 6f 63 20 28 6c 69 6e 65 62 75 66 66 65 72 2d 3e  oc (linebuffer->
07d0: 73 69 7a 65 29 3b 0a 7d 0a 0a 2f 2a 20 52 65 61  size);.}../* Rea
07e0: 64 20 61 6e 20 61 72 62 69 74 72 61 72 69 6c 79  d an arbitrarily
07f0: 20 6c 6f 6e 67 20 6c 69 6e 65 20 6f 66 20 74 65   long line of te
0800: 78 74 20 66 72 6f 6d 20 53 54 52 45 41 4d 20 69  xt from STREAM i
0810: 6e 74 6f 20 4c 49 4e 45 42 55 46 46 45 52 2e 0a  nto LINEBUFFER..
0820: 20 20 20 4b 65 65 70 20 74 68 65 20 6e 65 77 6c     Keep the newl
0830: 69 6e 65 3b 20 61 70 70 65 6e 64 20 61 20 6e 65  ine; append a ne
0840: 77 6c 69 6e 65 20 69 66 20 69 74 27 73 20 74 68  wline if it's th
0850: 65 20 6c 61 73 74 20 6c 69 6e 65 20 6f 66 20 61  e last line of a
0860: 20 66 69 6c 65 0a 20 20 20 74 68 61 74 20 65 6e   file.   that en
0870: 64 73 20 69 6e 20 61 20 6e 6f 6e 2d 6e 65 77 6c  ds in a non-newl
0880: 69 6e 65 20 63 68 61 72 61 63 74 65 72 2e 20 20  ine character.  
0890: 44 6f 20 6e 6f 74 20 6e 75 6c 6c 20 74 65 72 6d  Do not null term
08a0: 69 6e 61 74 65 2e 0a 20 20 20 52 65 74 75 72 6e  inate..   Return
08b0: 20 4c 49 4e 45 42 55 46 46 45 52 2c 20 65 78 63   LINEBUFFER, exc
08c0: 65 70 74 20 61 74 20 65 6e 64 20 6f 66 20 66 69  ept at end of fi
08d0: 6c 65 20 72 65 74 75 72 6e 20 30 2e 20 20 2a 2f  le return 0.  */
08e0: 0a 0a 73 74 61 74 69 63 20 73 74 72 75 63 74 20  ..static struct 
08f0: 6c 69 6e 65 62 75 66 66 65 72 20 2a 0a 72 65 61  linebuffer *.rea
0900: 64 6c 69 6e 65 20 28 73 74 72 75 63 74 20 6c 69  dline (struct li
0910: 6e 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 62 75  nebuffer *linebu
0920: 66 66 65 72 2c 20 46 49 4c 45 20 2a 73 74 72 65  ffer, FILE *stre
0930: 61 6d 29 0a 7b 0a 20 20 69 6e 74 20 63 3b 0a 20  am).{.  int c;. 
0940: 20 63 68 61 72 20 2a 62 75 66 66 65 72 20 3d 20   char *buffer = 
0950: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66  linebuffer->buff
0960: 65 72 3b 0a 20 20 63 68 61 72 20 2a 70 20 3d 20  er;.  char *p = 
0970: 6c 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66  linebuffer->buff
0980: 65 72 3b 0a 20 20 63 68 61 72 20 2a 65 6e 64 20  er;.  char *end 
0990: 3d 20 62 75 66 66 65 72 20 2b 20 6c 69 6e 65 62  = buffer + lineb
09a0: 75 66 66 65 72 2d 3e 73 69 7a 65 20 2d 20 31 3b  uffer->size - 1;
09b0: 20 2f 2a 20 53 65 6e 74 69 6e 65 6c 2e 20 2a 2f   /* Sentinel. */
09c0: 0a 0a 20 20 69 66 20 28 66 65 6f 66 20 28 73 74  ..  if (feof (st
09d0: 72 65 61 6d 29 20 7c 7c 20 66 65 72 72 6f 72 20  ream) || ferror 
09e0: 28 73 74 72 65 61 6d 29 29 0a 20 20 20 20 72 65  (stream)).    re
09f0: 74 75 72 6e 20 30 3b 0a 0a 20 20 64 6f 0a 20 20  turn 0;..  do.  
0a00: 20 20 7b 0a 20 20 20 20 20 20 63 20 3d 20 67 65    {.      c = ge
0a10: 74 63 20 28 73 74 72 65 61 6d 29 3b 0a 20 20 20  tc (stream);.   
0a20: 20 20 20 69 66 20 28 63 20 3d 3d 20 45 4f 46 29     if (c == EOF)
0a30: 0a 09 7b 0a 09 20 20 69 66 20 28 70 20 3d 3d 20  ..{..  if (p == 
0a40: 62 75 66 66 65 72 29 0a 09 20 20 20 20 72 65 74  buffer)..    ret
0a50: 75 72 6e 20 30 3b 0a 09 20 20 69 66 20 28 70 5b  urn 0;..  if (p[
0a60: 2d 31 5d 20 3d 3d 20 27 5c 6e 27 29 0a 09 20 20  -1] == '\n')..  
0a70: 20 20 62 72 65 61 6b 3b 0a 09 20 20 63 20 3d 20    break;..  c = 
0a80: 27 5c 6e 27 3b 0a 09 7d 0a 20 20 20 20 20 20 69  '\n';..}.      i
0a90: 66 20 28 70 20 3d 3d 20 65 6e 64 29 0a 09 7b 0a  f (p == end)..{.
0aa0: 09 20 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73  .  linebuffer->s
0ab0: 69 7a 65 20 2a 3d 20 32 3b 0a 09 20 20 62 75 66  ize *= 2;..  buf
0ac0: 66 65 72 20 3d 20 28 63 68 61 72 20 2a 29 20 78  fer = (char *) x
0ad0: 72 65 61 6c 6c 6f 63 20 28 62 75 66 66 65 72 2c  realloc (buffer,
0ae0: 20 6c 69 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a   linebuffer->siz
0af0: 65 29 3b 0a 09 20 20 70 20 3d 20 70 20 2d 20 6c  e);..  p = p - l
0b00: 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65  inebuffer->buffe
0b10: 72 20 2b 20 62 75 66 66 65 72 3b 0a 09 20 20 6c  r + buffer;..  l
0b20: 69 6e 65 62 75 66 66 65 72 2d 3e 62 75 66 66 65  inebuffer->buffe
0b30: 72 20 3d 20 62 75 66 66 65 72 3b 0a 09 20 20 65  r = buffer;..  e
0b40: 6e 64 20 3d 20 62 75 66 66 65 72 20 2b 20 6c 69  nd = buffer + li
0b50: 6e 65 62 75 66 66 65 72 2d 3e 73 69 7a 65 20 2d  nebuffer->size -
0b60: 20 31 3b 0a 09 7d 0a 20 20 20 20 20 20 2a 70 2b   1;..}.      *p+
0b70: 2b 20 3d 20 63 3b 0a 20 20 20 20 7d 0a 20 20 77  + = c;.    }.  w
0b80: 68 69 6c 65 20 28 63 20 21 3d 20 27 5c 6e 27 29  hile (c != '\n')
0b90: 3b 0a 0a 20 20 6c 69 6e 65 62 75 66 66 65 72 2d  ;..  linebuffer-
0ba0: 3e 6c 65 6e 67 74 68 20 3d 20 70 20 2d 20 62 75  >length = p - bu
0bb0: 66 66 65 72 3b 0a 20 20 72 65 74 75 72 6e 20 6c  ffer;.  return l
0bc0: 69 6e 65 62 75 66 66 65 72 3b 0a 7d 0a 0a 2f 2a  inebuffer;.}../*
0bd0: 20 46 72 65 65 20 6c 69 6e 65 62 75 66 66 65 72   Free linebuffer
0be0: 20 4c 49 4e 45 42 55 46 46 45 52 27 73 20 64 61   LINEBUFFER's da
0bf0: 74 61 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76  ta. */..static v
0c00: 6f 69 64 0a 66 72 65 65 62 75 66 66 65 72 20 28  oid.freebuffer (
0c10: 73 74 72 75 63 74 20 6c 69 6e 65 62 75 66 66 65  struct linebuffe
0c20: 72 20 2a 6c 69 6e 65 62 75 66 66 65 72 29 0a 7b  r *linebuffer).{
0c30: 0a 20 20 66 72 65 65 20 28 6c 69 6e 65 62 75 66  .  free (linebuf
0c40: 66 65 72 2d 3e 62 75 66 66 65 72 29 3b 0a 7d 0a  fer->buffer);.}.
0c50: 0a 2f 2a 20 55 6e 64 65 66 69 6e 65 2c 20 74 6f  ./* Undefine, to
0c60: 20 61 76 6f 69 64 20 77 61 72 6e 69 6e 67 20 61   avoid warning a
0c70: 62 6f 75 74 20 72 65 64 65 66 69 6e 69 74 69 6f  bout redefinitio
0c80: 6e 20 6f 6e 20 73 6f 6d 65 20 73 79 73 74 65 6d  n on some system
0c90: 73 2e 20 20 2a 2f 0a 23 75 6e 64 65 66 20 6d 69  s.  */.#undef mi
0ca0: 6e 0a 23 64 65 66 69 6e 65 20 6d 69 6e 28 78 2c  n.#define min(x,
0cb0: 20 79 29 20 28 28 78 29 20 3c 20 28 79 29 20 3f   y) ((x) < (y) ?
0cc0: 20 28 78 29 20 3a 20 28 79 29 29 0a 0a 2f 2a 20   (x) : (y))../* 
0cd0: 52 65 74 75 72 6e 20 7a 65 72 6f 20 69 66 20 74  Return zero if t
0ce0: 77 6f 20 73 74 72 69 6e 67 73 20 4f 4c 44 20 61  wo strings OLD a
0cf0: 6e 64 20 4e 45 57 20 6d 61 74 63 68 2c 20 6e 6f  nd NEW match, no
0d00: 6e 7a 65 72 6f 20 69 66 20 6e 6f 74 2e 0a 20 20  nzero if not..  
0d10: 20 4f 4c 44 20 61 6e 64 20 4e 45 57 20 70 6f 69   OLD and NEW poi
0d20: 6e 74 20 6e 6f 74 20 74 6f 20 74 68 65 20 62 65  nt not to the be
0d30: 67 69 6e 6e 69 6e 67 73 20 6f 66 20 74 68 65 20  ginnings of the 
0d40: 6c 69 6e 65 73 0a 20 20 20 62 75 74 20 72 61 74  lines.   but rat
0d50: 68 65 72 20 74 6f 20 74 68 65 20 62 65 67 69 6e  her to the begin
0d60: 6e 69 6e 67 73 20 6f 66 20 74 68 65 20 66 69 65  nings of the fie
0d70: 6c 64 73 20 74 6f 20 63 6f 6d 70 61 72 65 2e 0a  lds to compare..
0d80: 20 20 20 4f 4c 44 4c 45 4e 20 61 6e 64 20 4e 45     OLDLEN and NE
0d90: 57 4c 45 4e 20 61 72 65 20 74 68 65 69 72 20 6c  WLEN are their l
0da0: 65 6e 67 74 68 73 2e 20 2a 2f 0a 0a 73 74 61 74  engths. */..stat
0db0: 69 63 20 69 6e 74 0a 64 69 66 66 65 72 65 6e 74  ic int.different
0dc0: 20 28 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f 6c   (const char *ol
0dd0: 64 2c 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6e  d, const char *n
0de0: 65 77 2c 20 73 69 7a 65 5f 74 20 6f 6c 64 6c 65  ew, size_t oldle
0df0: 6e 2c 20 73 69 7a 65 5f 74 20 6e 65 77 6c 65 6e  n, size_t newlen
0e00: 29 0a 7b 0a 20 20 69 6e 74 20 6f 72 64 65 72 3b  ).{.  int order;
0e10: 0a 0a 20 20 6f 72 64 65 72 20 3d 20 6d 65 6d 63  ..  order = memc
0e20: 6d 70 20 28 6f 6c 64 2c 20 6e 65 77 2c 20 6d 69  mp (old, new, mi
0e30: 6e 20 28 6f 6c 64 6c 65 6e 2c 20 6e 65 77 6c 65  n (oldlen, newle
0e40: 6e 29 29 3b 0a 0a 20 20 69 66 20 28 6f 72 64 65  n));..  if (orde
0e50: 72 20 3d 3d 20 30 29 0a 20 20 20 20 72 65 74 75  r == 0).    retu
0e60: 72 6e 20 6f 6c 64 6c 65 6e 20 2d 20 6e 65 77 6c  rn oldlen - newl
0e70: 65 6e 3b 0a 20 20 72 65 74 75 72 6e 20 6f 72 64  en;.  return ord
0e80: 65 72 3b 0a 7d 0a 0a 2f 2a 20 4f 75 74 70 75 74  er;.}../* Output
0e90: 20 74 68 65 20 6c 69 6e 65 20 69 6e 20 6c 69 6e   the line in lin
0ea0: 65 62 75 66 66 65 72 20 4c 49 4e 45 20 74 6f 20  ebuffer LINE to 
0eb0: 73 74 72 65 61 6d 20 53 54 52 45 41 4d 0a 20 20  stream STREAM.  
0ec0: 20 70 72 6f 76 69 64 65 64 20 74 68 61 74 20 74   provided that t
0ed0: 68 65 20 73 77 69 74 63 68 65 73 20 73 61 79 20  he switches say 
0ee0: 69 74 20 73 68 6f 75 6c 64 20 62 65 20 6f 75 74  it should be out
0ef0: 70 75 74 2e 0a 20 20 20 49 66 20 72 65 71 75 65  put..   If reque
0f00: 73 74 65 64 2c 20 70 72 69 6e 74 20 74 68 65 20  sted, print the 
0f10: 6e 75 6d 62 65 72 20 6f 66 20 74 69 6d 65 73 20  number of times 
0f20: 69 74 20 6f 63 63 75 72 72 65 64 2c 20 61 73 20  it occurred, as 
0f30: 77 65 6c 6c 3b 0a 20 20 20 4c 49 4e 45 43 4f 55  well;.   LINECOU
0f40: 4e 54 20 2b 20 31 20 69 73 20 74 68 65 20 6e 75  NT + 1 is the nu
0f50: 6d 62 65 72 20 6f 66 20 74 69 6d 65 73 20 74 68  mber of times th
0f60: 61 74 20 74 68 65 20 6c 69 6e 65 20 6f 63 63 75  at the line occu
0f70: 72 72 65 64 2e 20 2a 2f 0a 0a 73 74 61 74 69 63  rred. */..static
0f80: 20 76 6f 69 64 0a 77 72 69 74 65 6c 69 6e 65 20   void.writeline 
0f90: 28 63 6f 6e 73 74 20 73 74 72 75 63 74 20 6c 69  (const struct li
0fa0: 6e 65 62 75 66 66 65 72 20 2a 6c 69 6e 65 2c 20  nebuffer *line, 
0fb0: 46 49 4c 45 20 2a 73 74 72 65 61 6d 2c 20 69 6e  FILE *stream, in
0fc0: 74 20 6c 69 6e 65 63 6f 75 6e 74 29 0a 7b 0a 20  t linecount).{. 
0fd0: 20 69 66 20 28 6c 69 6e 65 63 6f 75 6e 74 20 3d   if (linecount =
0fe0: 3d 20 30 29 0a 20 20 20 20 66 77 72 69 74 65 20  = 0).    fwrite 
0ff0: 28 6c 69 6e 65 2d 3e 62 75 66 66 65 72 2c 20 31  (line->buffer, 1
1000: 2c 20 6c 69 6e 65 2d 3e 6c 65 6e 67 74 68 2c 20  , line->length, 
1010: 73 74 72 65 61 6d 29 3b 0a 7d 0a 0a 2f 2a 20 50  stream);.}../* P
1020: 72 6f 63 65 73 73 20 69 6e 70 75 74 20 66 69 6c  rocess input fil
1030: 65 20 49 4e 46 49 4c 45 20 77 69 74 68 20 6f 75  e INFILE with ou
1040: 74 70 75 74 20 74 6f 20 4f 55 54 46 49 4c 45 2e  tput to OUTFILE.
1050: 0a 20 20 20 49 66 20 65 69 74 68 65 72 20 69 73  .   If either is
1060: 20 22 2d 22 2c 20 75 73 65 20 74 68 65 20 73 74   "-", use the st
1070: 61 6e 64 61 72 64 20 49 2f 4f 20 73 74 72 65 61  andard I/O strea
1080: 6d 20 66 6f 72 20 69 74 20 69 6e 73 74 65 61 64  m for it instead
1090: 2e 20 2a 2f 0a 0a 73 74 61 74 69 63 20 76 6f 69  . */..static voi
10a0: 64 0a 63 68 65 63 6b 5f 66 69 6c 65 20 28 63 6f  d.check_file (co
10b0: 6e 73 74 20 63 68 61 72 20 2a 69 6e 66 69 6c 65  nst char *infile
10c0: 2c 20 63 6f 6e 73 74 20 63 68 61 72 20 2a 6f 75  , const char *ou
10d0: 74 66 69 6c 65 29 0a 7b 0a 20 20 46 49 4c 45 20  tfile).{.  FILE 
10e0: 2a 69 73 74 72 65 61 6d 3b 0a 20 20 46 49 4c 45  *istream;.  FILE
10f0: 20 2a 6f 73 74 72 65 61 6d 3b 0a 20 20 73 74 72   *ostream;.  str
1100: 75 63 74 20 6c 69 6e 65 62 75 66 66 65 72 20 6c  uct linebuffer l
1110: 62 31 2c 20 6c 62 32 3b 0a 20 20 73 74 72 75 63  b1, lb2;.  struc
1120: 74 20 6c 69 6e 65 62 75 66 66 65 72 20 2a 74 68  t linebuffer *th
1130: 69 73 6c 69 6e 65 2c 20 2a 70 72 65 76 6c 69 6e  isline, *prevlin
1140: 65 2c 20 2a 65 78 63 68 3b 0a 20 20 63 68 61 72  e, *exch;.  char
1150: 20 2a 70 72 65 76 66 69 65 6c 64 2c 20 2a 74 68   *prevfield, *th
1160: 69 73 66 69 65 6c 64 3b 0a 20 20 73 69 7a 65 5f  isfield;.  size_
1170: 74 20 70 72 65 76 6c 65 6e 2c 20 74 68 69 73 6c  t prevlen, thisl
1180: 65 6e 3b 0a 20 20 69 6e 74 20 6d 61 74 63 68 5f  en;.  int match_
1190: 63 6f 75 6e 74 20 3d 20 30 3b 0a 0a 20 20 69 66  count = 0;..  if
11a0: 20 28 21 73 74 72 63 6d 70 20 28 69 6e 66 69 6c   (!strcmp (infil
11b0: 65 2c 20 22 2d 22 29 29 0a 20 20 20 20 69 73 74  e, "-")).    ist
11c0: 72 65 61 6d 20 3d 20 73 74 64 69 6e 3b 0a 20 20  ream = stdin;.  
11d0: 65 6c 73 65 0a 20 20 20 20 69 73 74 72 65 61 6d  else.    istream
11e0: 20 3d 20 66 6f 70 65 6e 20 28 69 6e 66 69 6c 65   = fopen (infile
11f0: 2c 20 22 72 22 29 3b 0a 20 20 69 66 20 28 69 73  , "r");.  if (is
1200: 74 72 65 61 6d 20 3d 3d 20 4e 55 4c 4c 29 0a 20  tream == NULL). 
1210: 20 20 20 7b 0a 20 20 20 20 20 20 66 70 72 69 6e     {.      fprin
1220: 74 66 20 28 73 74 64 65 72 72 2c 20 22 25 73 3a  tf (stderr, "%s:
1230: 20 65 72 72 6f 72 20 6f 70 65 6e 69 6e 67 20 25   error opening %
1240: 73 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61  s\n", program_na
1250: 6d 65 2c 20 69 6e 66 69 6c 65 29 3b 0a 20 20 20  me, infile);.   
1260: 20 20 20 65 78 69 74 20 28 31 29 3b 0a 20 20 20     exit (1);.   
1270: 20 7d 0a 0a 20 20 69 66 20 28 21 73 74 72 63 6d   }..  if (!strcm
1280: 70 20 28 6f 75 74 66 69 6c 65 2c 20 22 2d 22 29  p (outfile, "-")
1290: 29 0a 20 20 20 20 6f 73 74 72 65 61 6d 20 3d 20  ).    ostream = 
12a0: 73 74 64 6f 75 74 3b 0a 20 20 65 6c 73 65 0a 20  stdout;.  else. 
12b0: 20 20 20 6f 73 74 72 65 61 6d 20 3d 20 66 6f 70     ostream = fop
12c0: 65 6e 20 28 6f 75 74 66 69 6c 65 2c 20 22 77 22  en (outfile, "w"
12d0: 29 3b 0a 20 20 69 66 20 28 6f 73 74 72 65 61 6d  );.  if (ostream
12e0: 20 3d 3d 20 4e 55 4c 4c 29 0a 20 20 20 20 7b 0a   == NULL).    {.
12f0: 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28 73        fprintf (s
1300: 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72 6f  tderr, "%s: erro
1310: 72 20 6f 70 65 6e 69 6e 67 20 25 73 5c 6e 22 2c  r opening %s\n",
1320: 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20 6f   program_name, o
1330: 75 74 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65  utfile);.      e
1340: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a  xit (1);.    }..
1350: 20 20 74 68 69 73 6c 69 6e 65 20 3d 20 26 6c 62    thisline = &lb
1360: 31 3b 0a 20 20 70 72 65 76 6c 69 6e 65 20 3d 20  1;.  prevline = 
1370: 26 6c 62 32 3b 0a 0a 20 20 69 6e 69 74 62 75 66  &lb2;..  initbuf
1380: 66 65 72 20 28 74 68 69 73 6c 69 6e 65 29 3b 0a  fer (thisline);.
1390: 20 20 69 6e 69 74 62 75 66 66 65 72 20 28 70 72    initbuffer (pr
13a0: 65 76 6c 69 6e 65 29 3b 0a 0a 20 20 69 66 20 28  evline);..  if (
13b0: 72 65 61 64 6c 69 6e 65 20 28 70 72 65 76 6c 69  readline (prevli
13c0: 6e 65 2c 20 69 73 74 72 65 61 6d 29 20 3d 3d 20  ne, istream) == 
13d0: 30 29 0a 20 20 20 20 67 6f 74 6f 20 63 6c 6f 73  0).    goto clos
13e0: 65 66 69 6c 65 73 3b 0a 20 20 70 72 65 76 66 69  efiles;.  prevfi
13f0: 65 6c 64 20 3d 20 70 72 65 76 6c 69 6e 65 2d 3e  eld = prevline->
1400: 62 75 66 66 65 72 3b 0a 20 20 70 72 65 76 6c 65  buffer;.  prevle
1410: 6e 20 3d 20 70 72 65 76 6c 69 6e 65 2d 3e 6c 65  n = prevline->le
1420: 6e 67 74 68 3b 0a 0a 20 20 77 68 69 6c 65 20 28  ngth;..  while (
1430: 21 66 65 6f 66 20 28 69 73 74 72 65 61 6d 29 29  !feof (istream))
1440: 0a 20 20 20 20 7b 0a 20 20 20 20 20 20 69 6e 74  .    {.      int
1450: 20 6d 61 74 63 68 3b 0a 20 20 20 20 20 20 69 66   match;.      if
1460: 20 28 72 65 61 64 6c 69 6e 65 20 28 74 68 69 73   (readline (this
1470: 6c 69 6e 65 2c 20 69 73 74 72 65 61 6d 29 20 3d  line, istream) =
1480: 3d 20 30 29 0a 09 62 72 65 61 6b 3b 0a 20 20 20  = 0)..break;.   
1490: 20 20 20 74 68 69 73 66 69 65 6c 64 20 3d 20 74     thisfield = t
14a0: 68 69 73 6c 69 6e 65 2d 3e 62 75 66 66 65 72 3b  hisline->buffer;
14b0: 0a 20 20 20 20 20 20 74 68 69 73 6c 65 6e 20 3d  .      thislen =
14c0: 20 74 68 69 73 6c 69 6e 65 2d 3e 6c 65 6e 67 74   thisline->lengt
14d0: 68 3b 0a 20 20 20 20 20 20 6d 61 74 63 68 20 3d  h;.      match =
14e0: 20 21 64 69 66 66 65 72 65 6e 74 20 28 74 68 69   !different (thi
14f0: 73 66 69 65 6c 64 2c 20 70 72 65 76 66 69 65 6c  sfield, prevfiel
1500: 64 2c 20 74 68 69 73 6c 65 6e 2c 20 70 72 65 76  d, thislen, prev
1510: 6c 65 6e 29 3b 0a 0a 20 20 20 20 20 20 69 66 20  len);..      if 
1520: 28 6d 61 74 63 68 29 0a 09 2b 2b 6d 61 74 63 68  (match)..++match
1530: 5f 63 6f 75 6e 74 3b 0a 0a 20 20 20 20 20 20 69  _count;..      i
1540: 66 20 28 21 6d 61 74 63 68 29 0a 09 7b 0a 09 20  f (!match)..{.. 
1550: 20 77 72 69 74 65 6c 69 6e 65 20 28 70 72 65 76   writeline (prev
1560: 6c 69 6e 65 2c 20 6f 73 74 72 65 61 6d 2c 20 6d  line, ostream, m
1570: 61 74 63 68 5f 63 6f 75 6e 74 29 3b 0a 09 20 20  atch_count);..  
1580: 65 78 63 68 20 3d 20 70 72 65 76 6c 69 6e 65 3b  exch = prevline;
1590: 0a 09 20 20 70 72 65 76 6c 69 6e 65 20 3d 20 74  ..  prevline = t
15a0: 68 69 73 6c 69 6e 65 3b 0a 09 20 20 74 68 69 73  hisline;..  this
15b0: 6c 69 6e 65 20 3d 20 65 78 63 68 3b 0a 09 20 20  line = exch;..  
15c0: 70 72 65 76 66 69 65 6c 64 20 3d 20 74 68 69 73  prevfield = this
15d0: 66 69 65 6c 64 3b 0a 09 20 20 70 72 65 76 6c 65  field;..  prevle
15e0: 6e 20 3d 20 74 68 69 73 6c 65 6e 3b 0a 09 20 20  n = thislen;..  
15f0: 69 66 20 28 21 6d 61 74 63 68 29 0a 09 20 20 20  if (!match)..   
1600: 20 6d 61 74 63 68 5f 63 6f 75 6e 74 20 3d 20 30   match_count = 0
1610: 3b 0a 09 7d 0a 20 20 20 20 7d 0a 0a 20 20 77 72  ;..}.    }..  wr
1620: 69 74 65 6c 69 6e 65 20 28 70 72 65 76 6c 69 6e  iteline (prevlin
1630: 65 2c 20 6f 73 74 72 65 61 6d 2c 20 6d 61 74 63  e, ostream, matc
1640: 68 5f 63 6f 75 6e 74 29 3b 0a 0a 20 63 6c 6f 73  h_count);.. clos
1650: 65 66 69 6c 65 73 3a 0a 20 20 69 66 20 28 66 65  efiles:.  if (fe
1660: 72 72 6f 72 20 28 69 73 74 72 65 61 6d 29 20 7c  rror (istream) |
1670: 7c 20 66 63 6c 6f 73 65 20 28 69 73 74 72 65 61  | fclose (istrea
1680: 6d 29 20 3d 3d 20 45 4f 46 29 0a 20 20 20 20 7b  m) == EOF).    {
1690: 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20 28  .      fprintf (
16a0: 73 74 64 65 72 72 2c 20 22 25 73 3a 20 65 72 72  stderr, "%s: err
16b0: 6f 72 20 72 65 61 64 69 6e 67 20 25 73 5c 6e 22  or reading %s\n"
16c0: 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d 65 2c 20  , program_name, 
16d0: 69 6e 66 69 6c 65 29 3b 0a 20 20 20 20 20 20 65  infile);.      e
16e0: 78 69 74 20 28 31 29 3b 0a 20 20 20 20 7d 0a 0a  xit (1);.    }..
16f0: 20 20 69 66 20 28 66 65 72 72 6f 72 20 28 6f 73    if (ferror (os
1700: 74 72 65 61 6d 29 20 7c 7c 20 66 63 6c 6f 73 65  tream) || fclose
1710: 20 28 6f 73 74 72 65 61 6d 29 20 3d 3d 20 45 4f   (ostream) == EO
1720: 46 29 0a 20 20 20 20 7b 0a 20 20 20 20 20 20 66  F).    {.      f
1730: 70 72 69 6e 74 66 20 28 73 74 64 65 72 72 2c 20  printf (stderr, 
1740: 22 25 73 3a 20 65 72 72 6f 72 20 77 72 69 74 69  "%s: error writi
1750: 6e 67 20 25 73 5c 6e 22 2c 20 70 72 6f 67 72 61  ng %s\n", progra
1760: 6d 5f 6e 61 6d 65 2c 20 6f 75 74 66 69 6c 65 29  m_name, outfile)
1770: 3b 0a 20 20 20 20 20 20 65 78 69 74 20 28 31 29  ;.      exit (1)
1780: 3b 0a 20 20 20 20 7d 0a 0a 20 20 66 72 65 65 62  ;.    }..  freeb
1790: 75 66 66 65 72 20 28 26 6c 62 31 29 3b 0a 20 20  uffer (&lb1);.  
17a0: 66 72 65 65 62 75 66 66 65 72 20 28 26 6c 62 32  freebuffer (&lb2
17b0: 29 3b 0a 7d 0a 0a 69 6e 74 0a 6d 61 69 6e 20 28  );.}..int.main (
17c0: 69 6e 74 20 61 72 67 63 2c 20 63 68 61 72 20 2a  int argc, char *
17d0: 2a 61 72 67 76 29 0a 7b 0a 20 20 63 6f 6e 73 74  *argv).{.  const
17e0: 20 63 68 61 72 20 2a 69 6e 66 69 6c 65 20 3d 20   char *infile = 
17f0: 22 2d 22 3b 0a 20 20 63 6f 6e 73 74 20 63 68 61  "-";.  const cha
1800: 72 20 2a 6f 75 74 66 69 6c 65 20 3d 20 22 2d 22  r *outfile = "-"
1810: 3b 0a 20 20 69 6e 74 20 6f 70 74 69 6e 64 20 3d  ;.  int optind =
1820: 20 31 3b 0a 0a 20 20 70 72 6f 67 72 61 6d 5f 6e   1;..  program_n
1830: 61 6d 65 20 3d 20 61 72 67 76 5b 30 5d 3b 0a 0a  ame = argv[0];..
1840: 20 20 69 66 20 28 6f 70 74 69 6e 64 20 3c 20 61    if (optind < a
1850: 72 67 63 29 0a 20 20 20 20 69 6e 66 69 6c 65 20  rgc).    infile 
1860: 3d 20 61 72 67 76 5b 6f 70 74 69 6e 64 2b 2b 5d  = argv[optind++]
1870: 3b 0a 0a 20 20 69 66 20 28 6f 70 74 69 6e 64 20  ;..  if (optind 
1880: 3c 20 61 72 67 63 29 0a 20 20 20 20 6f 75 74 66  < argc).    outf
1890: 69 6c 65 20 3d 20 61 72 67 76 5b 6f 70 74 69 6e  ile = argv[optin
18a0: 64 2b 2b 5d 3b 0a 0a 20 20 69 66 20 28 6f 70 74  d++];..  if (opt
18b0: 69 6e 64 20 3c 20 61 72 67 63 29 0a 20 20 20 20  ind < argc).    
18c0: 7b 0a 20 20 20 20 20 20 66 70 72 69 6e 74 66 20  {.      fprintf 
18d0: 28 73 74 64 65 72 72 2c 20 22 25 73 3a 20 74 6f  (stderr, "%s: to
18e0: 6f 20 6d 61 6e 79 20 61 72 67 75 6d 65 6e 74 73  o many arguments
18f0: 5c 6e 22 2c 20 70 72 6f 67 72 61 6d 5f 6e 61 6d  \n", program_nam
1900: 65 29 3b 0a 20 20 20 20 20 20 65 78 69 74 20 28  e);.      exit (
1910: 31 29 3b 0a 20 20 20 20 7d 0a 0a 20 20 63 68 65  1);.    }..  che
1920: 63 6b 5f 66 69 6c 65 20 28 69 6e 66 69 6c 65 2c  ck_file (infile,
1930: 20 6f 75 74 66 69 6c 65 29 3b 0a 0a 20 20 65 78   outfile);..  ex
1940: 69 74 20 28 30 29 3b 0a 7d 0a                    it (0);.}.