[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[tyndur-devel] [PATCH 2/3] libc: Ein bisschen mehr wchar.h



+ libc: Die Funktionen mbrtowc, wcrtomb, wcwidth und wcswidth, damit
        kommt curses schon weiter beim Kompilieren mit UTF-8-Support
---
 src/include/limits.h                 |    3 +
 src/modules/include/wchar.h          |   52 +++++++++++++++++
 src/modules/lib/posix/regex/regex2.h |    8 ---
 src/modules/lib/stdlibc/wchar.c      |  101 ++++++++++++++++++++++++++++++++++
 4 files changed, 156 insertions(+), 8 deletions(-)
 create mode 100644 src/modules/lib/stdlibc/wchar.c

diff --git a/src/include/limits.h b/src/include/limits.h
index 1ea8cc5..62f8399 100644
--- a/src/include/limits.h
+++ b/src/include/limits.h
@@ -57,4 +57,7 @@
 
 #define _POSIX_PATH_MAX 4096
 
+/**  Maximale laenge eines Multibyte-Zeichens in Bytes */
+#define MB_LEN_MAX 4
+
 #endif
diff --git a/src/modules/include/wchar.h b/src/modules/include/wchar.h
index d173bce..6ed1d51 100644
--- a/src/modules/include/wchar.h
+++ b/src/modules/include/wchar.h
@@ -34,8 +34,60 @@
 
 #define WEOF ((wint_t) -1)
 
+/**
+ * Sollte theoretisch alle Werte von wchar_t und zusaetzlich WEOF annehmen
+ * koennen.
+ */
 typedef wchar_t wint_t;
 
+/**
+ * Repraesentiert den internen Shift-Status einer Funktion, brauchen wir mit
+ * UTF-8 nicht.
+ */
+typedef int mbstate_t;
+
+
+
+/* WSTRINGS */
+
+/**
+ * Reentrante Variante von mbtowc, bei uns mit UTF-8 aber identisch.
+ * @see mbtowc
+ */
+size_t mbrtowc(wchar_t* wc, const char* s, size_t len, mbstate_t* ps);
+
+/**
+ * Reentrante Variante von wctomb, bei uns mit UTF-8 aber identisch.
+ * @see wctomb
+ */
+size_t wcrtomb(char* buf, wchar_t wc, mbstate_t* ps);
+
+
+/**
+ * Anzahl der Spalten, die ein Zeichen in Anspruch nimmt, errechnen. Fuer c = 0
+ * wird 0 zuruekgegeben. Falls es sich nicht um ein druckbares Zeichen handelt,
+ * wird -1 zurueckgegeben.
+ *
+ * @param wc Das breite Zeichen
+ *
+ * @return Anzahl Spalten, oder -1 wenn das Zeichen nicht druckbar ist.
+ */
+int wcwidth(wchar_t wc);
+
+/**
+ * Anzahl der Spalten, die ein String aus breiten Zeichen in Anspruch nimmt,
+ * errechnen. Wird ein nicht druckbares Zeichen erkannt, wird abgebrochen.
+ *
+ * @see wcwidth
+ * @param wcs Zeiger auf das erste Zeichen
+ * @param len Anzahl der Zeichen
+ *
+ * @return Anzahl der Zeichen oder -1 im Fehlerfall.
+ */
+int wcswidth(const wchar_t* wcs, size_t len);
+
+
+
 /* WSTDIO */
 
 /**
diff --git a/src/modules/lib/posix/regex/regex2.h b/src/modules/lib/posix/regex/regex2.h
index 38855e8..294b4c4 100644
--- a/src/modules/lib/posix/regex/regex2.h
+++ b/src/modules/lib/posix/regex/regex2.h
@@ -159,11 +159,3 @@ struct re_guts {
 #define	OUT	(CHAR_MAX+1)	/* a non-character value */
 #define ISWORD(c)       (isalnum((uch)(c)) || (c) == '_')
 
-
-
-#include <stdint.h>
-typedef union {
-        int64_t __mbstateL;   /* for alignment */
-        char __mbstate8[128];
-} mbstate_t;
-
diff --git a/src/modules/lib/stdlibc/wchar.c b/src/modules/lib/stdlibc/wchar.c
new file mode 100644
index 0000000..79bb27e
--- /dev/null
+++ b/src/modules/lib/stdlibc/wchar.c
@@ -0,0 +1,101 @@
+/*
+ * Copyright (c) 2009 The tyndur Project. All rights reserved.
+ *
+ * This code is derived from software contributed to the tyndur Project
+ * by Antoine Kaufmann.
+ *
+ * Redistribution and use in source and binary forms, with or without
+ * modification, are permitted provided that the following conditions
+ * are met:
+ * 1. Redistributions of source code must retain the above copyright
+ *    notice, this list of conditions and the following disclaimer.
+ * 2. Redistributions in binary form must reproduce the above copyright
+ *    notice, this list of conditions and the following disclaimer in the
+ *    documentation and/or other materials provided with the distribution.
+ *
+ * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS
+ * ``AS IS'' AND ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED
+ * TO, THE IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR
+ * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE COPYRIGHT HOLDERS OR
+ * CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
+ * EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
+ * PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR PROFITS;
+ * OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY,
+ * WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR
+ * OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS SOFTWARE, EVEN IF
+ * ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
+ */
+
+#include <wchar.h>
+#include <stdlib.h>
+
+/**
+ * Reentrante Variante von mbtowc, bei uns mit UTF-8 aber identisch.
+ * @see mbtowc
+ */
+size_t mbrtowc(wchar_t* wc, const char* s, size_t len, mbstate_t* ps)
+{
+    return mbtowc(wc, s, len);
+}
+
+/**
+ * Reentrante Variante von wctomb, bei uns mit UTF-8 aber identisch.
+ * @see wctomb
+ */
+size_t wcrtomb(char* buf, wchar_t wc, mbstate_t* ps)
+{
+    return wctomb(buf, wc);
+}
+
+/**
+ * Anzahl der Spalten, die ein Zeichen in Anspruch nimmt, errechnen. Fuer c = 0
+ * wird 0 zuruekgegeben. Falls es sich nicht um ein druckbares Zeichen handelt,
+ * wird -1 zurueckgegeben.
+ *
+ * @param wc Das breite Zeichen
+ *
+ * @return Anzahl Spalten, oder -1 wenn das Zeichen nicht druckbar ist.
+ */
+int wcwidth(wchar_t wc)
+{
+    // Muss nach Spezifikation so sein
+    if (!wc) {
+        return 0;
+    }
+
+    // Steuerzeichen sind nicht druckbar
+    if (wc < 32) {
+        return -1;
+    }
+
+    // Das ist so sicher noch etwas rudimentaer, doch im Moment reicht das so
+    // fuer uns.
+    return 1;
+}
+
+/**
+ * Anzahl der Spalten, die ein String aus breiten Zeichen in Anspruch nimmt,
+ * errechnen. Wird ein nicht druckbares Zeichen erkannt, wird abgebrochen.
+ *
+ * @see wcwidth
+ * @param wcs Zeiger auf das erste Zeichen
+ * @param len Anzahl der Zeichen
+ *
+ * @return Anzahl der Zeichen oder -1 im Fehlerfall.
+ */
+int wcswidth(const wchar_t* wcs, size_t len)
+{
+    int cols = 0;
+    int cur;
+    size_t i;
+
+    for (i = 0; i < len; i++) {
+        if ((cur = wcwidth(wcs[i])) == -1) {
+            return -1;
+        }
+        cols += cur;
+    }
+
+    return cols;
+}
+
-- 
1.6.0.6