[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: [tyndur-devel] [PATCH 2/3] libc: Ein bisschen mehr wchar.h



Am Samstag, 25. April 2009 17:23 schrieb Antoine Kaufmann:
> + libc: Die Funktionen mbrtowc, wcrtomb, wcwidth und wcswidth, damit
>         kommt curses schon weiter beim Kompilieren mit UTF-8-Support
> ---
>  src/include/limits.h                 |    3 +
>  src/modules/include/wchar.h          |   52 +++++++++++++++++
>  src/modules/lib/posix/regex/regex2.h |    8 ---
>  src/modules/lib/stdlibc/wchar.c      |  101
> ++++++++++++++++++++++++++++++++++ 4 files changed, 156 insertions(+), 8
> deletions(-)
>  create mode 100644 src/modules/lib/stdlibc/wchar.c
>
> diff --git a/src/include/limits.h b/src/include/limits.h
> index 1ea8cc5..62f8399 100644
> --- a/src/include/limits.h
> +++ b/src/include/limits.h
> @@ -57,4 +57,7 @@
>
>  #define _POSIX_PATH_MAX 4096
>
> +/**  Maximale laenge eines Multibyte-Zeichens in Bytes */
> +#define MB_LEN_MAX 4
> +
>  #endif
> diff --git a/src/modules/include/wchar.h b/src/modules/include/wchar.h
> index d173bce..6ed1d51 100644
> --- a/src/modules/include/wchar.h
> +++ b/src/modules/include/wchar.h
> @@ -34,8 +34,60 @@
>
>  #define WEOF ((wint_t) -1)
>
> +/**
> + * Sollte theoretisch alle Werte von wchar_t und zusaetzlich WEOF annehmen
> + * koennen.
> + */
>  typedef wchar_t wint_t;
>
> +/**
> + * Repraesentiert den internen Shift-Status einer Funktion, brauchen wir
> mit + * UTF-8 nicht.
> + */
> +typedef int mbstate_t;
> +
> +
> +
> +/* WSTRINGS */
> +
> +/**
> + * Reentrante Variante von mbtowc, bei uns mit UTF-8 aber identisch.
> + * @see mbtowc
> + */
> +size_t mbrtowc(wchar_t* wc, const char* s, size_t len, mbstate_t* ps);
> +
> +/**
> + * Reentrante Variante von wctomb, bei uns mit UTF-8 aber identisch.
> + * @see wctomb
> + */
> +size_t wcrtomb(char* buf, wchar_t wc, mbstate_t* ps);
> +
> +
> +/**
> + * Anzahl der Spalten, die ein Zeichen in Anspruch nimmt, errechnen. Fuer
> c = 0 + * wird 0 zuruekgegeben. Falls es sich nicht um ein druckbares
> Zeichen handelt, + * wird -1 zurueckgegeben.
> + *
> + * @param wc Das breite Zeichen
> + *
> + * @return Anzahl Spalten, oder -1 wenn das Zeichen nicht druckbar ist.
> + */
> +int wcwidth(wchar_t wc);
> +
> +/**
> + * Anzahl der Spalten, die ein String aus breiten Zeichen in Anspruch
> nimmt, + * errechnen. Wird ein nicht druckbares Zeichen erkannt, wird
> abgebrochen. + *
> + * @see wcwidth
> + * @param wcs Zeiger auf das erste Zeichen
> + * @param len Anzahl der Zeichen
> + *
> + * @return Anzahl der Zeichen oder -1 im Fehlerfall.
> + */
> +int wcswidth(const wchar_t* wcs, size_t len);
> +
> +
> +
>  /* WSTDIO */
>
>  /**
> diff --git a/src/modules/lib/posix/regex/regex2.h
> b/src/modules/lib/posix/regex/regex2.h index 38855e8..294b4c4 100644
> --- a/src/modules/lib/posix/regex/regex2.h
> +++ b/src/modules/lib/posix/regex/regex2.h
> @@ -159,11 +159,3 @@ struct re_guts {
>  #define	OUT	(CHAR_MAX+1)	/* a non-character value */
>  #define ISWORD(c)       (isalnum((uch)(c)) || (c) == '_')
>
> -
> -
> -#include <stdint.h>
> -typedef union {
> -        int64_t __mbstateL;   /* for alignment */
> -        char __mbstate8[128];
> -} mbstate_t;
> -
> diff --git a/src/modules/lib/stdlibc/wchar.c
> b/src/modules/lib/stdlibc/wchar.c new file mode 100644
> index 0000000..79bb27e
> --- /dev/null
> +++ b/src/modules/lib/stdlibc/wchar.c
> @@ -0,0 +1,101 @@
> +/*
> + * Copyright (c) 2009 The tyndur Project. All rights reserved.
> + *
> + * This code is derived from software contributed to the tyndur Project
> + * by Antoine Kaufmann.
> + *
> + * Redistribution and use in source and binary forms, with or without
> + * modification, are permitted provided that the following conditions
> + * are met:
> + * 1. Redistributions of source code must retain the above copyright
> + *    notice, this list of conditions and the following disclaimer.
> + * 2. Redistributions in binary form must reproduce the above copyright
> + *    notice, this list of conditions and the following disclaimer in the
> + *    documentation and/or other materials provided with the distribution.
> + *
> + * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
> + * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT
> LIMITED + * TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A
> PARTICULAR + * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE COPYRIGHT
> HOLDERS OR + * CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL,
> SPECIAL, + * EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT
> LIMITED TO, + * PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE,
> DATA, OR PROFITS; + * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY
> THEORY OF LIABILITY, + * WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
> (INCLUDING NEGLIGENCE OR + * OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
> OF THIS SOFTWARE, EVEN IF + * ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
> + */
> +
> +#include <wchar.h>
> +#include <stdlib.h>
> +
> +/**
> + * Reentrante Variante von mbtowc, bei uns mit UTF-8 aber identisch.
> + * @see mbtowc
> + */
> +size_t mbrtowc(wchar_t* wc, const char* s, size_t len, mbstate_t* ps)
> +{
> +    return mbtowc(wc, s, len);
> +}
> +
> +/**
> + * Reentrante Variante von wctomb, bei uns mit UTF-8 aber identisch.
> + * @see wctomb
> + */
> +size_t wcrtomb(char* buf, wchar_t wc, mbstate_t* ps)
> +{
> +    return wctomb(buf, wc);
> +}
> +
> +/**
> + * Anzahl der Spalten, die ein Zeichen in Anspruch nimmt, errechnen. Fuer
> c = 0 + * wird 0 zuruekgegeben. Falls es sich nicht um ein druckbares
> Zeichen handelt, + * wird -1 zurueckgegeben.
> + *
> + * @param wc Das breite Zeichen
> + *
> + * @return Anzahl Spalten, oder -1 wenn das Zeichen nicht druckbar ist.
> + */
> +int wcwidth(wchar_t wc)
> +{
> +    // Muss nach Spezifikation so sein
> +    if (!wc) {
> +        return 0;
> +    }
> +
> +    // Steuerzeichen sind nicht druckbar
> +    if (wc < 32) {
> +        return -1;
> +    }
> +
> +    // Das ist so sicher noch etwas rudimentaer, doch im Moment reicht das
> so +    // fuer uns.
> +    return 1;
> +}
> +
> +/**
> + * Anzahl der Spalten, die ein String aus breiten Zeichen in Anspruch
> nimmt, + * errechnen. Wird ein nicht druckbares Zeichen erkannt, wird
> abgebrochen. + *
> + * @see wcwidth
> + * @param wcs Zeiger auf das erste Zeichen
> + * @param len Anzahl der Zeichen
> + *
> + * @return Anzahl der Zeichen oder -1 im Fehlerfall.
> + */
> +int wcswidth(const wchar_t* wcs, size_t len)
> +{
> +    int cols = 0;
> +    int cur;
> +    size_t i;
> +
> +    for (i = 0; i < len; i++) {
> +        if ((cur = wcwidth(wcs[i])) == -1) {
> +            return -1;
> +        }

Hier fehlt die Abbruchbedingung cur == L'\0', sonst wird über den String 
rausgelesen.

Ansonsten Ack.