07a646b72c89bb8ee442129d9e90d98919f6b94d
[paraslash.git] / net.c
1 /*
2  * Copyright (C) 2005-2013 Andre Noll <maan@systemlinux.org>
3  *
4  * Licensed under the GPL v2. For licencing details see COPYING.
5  */
6
7 /** \file net.c Networking-related helper functions. */
8
9 /*
10  * Since glibc 2.8, the _GNU_SOURCE feature test macro must be defined in order
11  * to obtain the definition of the ucred structure.
12  */
13 #define _GNU_SOURCE
14
15 #include <netinet/in.h>
16 #include <arpa/inet.h>
17 #include <sys/un.h>
18 #include <sys/types.h>
19 #include <sys/socket.h>
20 #include <netdb.h>
21
22 /* At least NetBSD needs these. */
23 #ifndef AI_V4MAPPED
24 #define AI_V4MAPPED 0
25 #endif
26 #ifndef AI_ALL
27 #define AI_ALL 0
28 #endif
29 #ifndef AI_ADDRCONFIG
30 #define AI_ADDRCONFIG 0
31 #endif
32
33 #include <regex.h>
34
35 #include "para.h"
36 #include "error.h"
37 #include "net.h"
38 #include "string.h"
39 #include "list.h"
40 #include "fd.h"
41
42 /**
43  * Parse and validate IPv4 address/netmask string.
44  *
45  * \param cidr    Address in CIDR notation
46  * \param addr    Copy of the IPv4 address part of \a cidr
47  * \param addrlen Size of \a addr in bytes
48  * \param netmask Value of the netmask part in \a cidr or the
49  *                default of 32 if not specified.
50  *
51  * \return Pointer to \a addr if succesful, NULL on error.
52  * \sa RFC 4632
53  */
54 char *parse_cidr(const char *cidr,
55                  char    *addr, ssize_t addrlen,
56                  int32_t *netmask)
57 {
58         const char *o = cidr;
59         char *c = addr, *end = c + (addrlen - 1);
60
61         *netmask = 0x20;
62
63         if (cidr == NULL || addrlen < 1)
64                 goto failed;
65
66         for (o = cidr; (*c = *o == '/'? '\0' : *o); c++, o++)
67                 if (c == end)
68                         goto failed;
69
70         if (*o == '/')
71                 if (para_atoi32(++o, netmask) < 0 ||
72                     *netmask < 0 || *netmask > 0x20)
73                         goto failed;
74
75         if (is_valid_ipv4_address(addr))
76                 return addr;
77 failed:
78         *addr = '\0';
79         return NULL;
80 }
81
82
83 /**
84  * Match string as a candidate IPv4 address.
85  *
86  * \param address The string to match.
87  * \return True if \a address has "dot-quad" format.
88  */
89 static bool is_v4_dot_quad(const char *address)
90 {
91         bool result;
92         regex_t r;
93
94         assert(para_regcomp(&r, "^([0-9]+\\.){3}[0-9]+$",
95                 REG_EXTENDED | REG_NOSUB) >= 0);
96         result = regexec(&r, address, 0, NULL, 0) == 0;
97         regfree(&r);
98         return result;
99 }
100
101 /**
102  * Perform basic syntax checking on the host-part of an URL:
103  *
104  * - Since ':' is invalid in IPv4 addresses and DNS names, the
105  *   presence of ':' causes interpretation as IPv6 address;
106  * - next the first-match-wins algorithm from RFC 3986 is applied;
107  * - else the string is considered as DNS name, to be resolved later.
108  *
109  * \param host The host string to check.
110  * \return True if \a host passes the syntax checks.
111  *
112  * \sa RFC 3986, 3.2.2; RFC 1123, 2.1; RFC 1034, 3.5
113  */
114 static bool host_string_ok(const char *host)
115 {
116         if (host == NULL || *host == '\0')
117                 return false;
118         if (strchr(host, ':') != NULL)
119                 return is_valid_ipv6_address(host);
120         if (is_v4_dot_quad(host))
121                 return is_valid_ipv4_address(host);
122         return true;
123 }
124
125 /**
126  * Parse and validate URL string.
127  *
128  * The URL syntax is loosely based on RFC 3986, supporting one of
129  * - "["host"]"[:port] for native IPv6 addresses and
130  * - host[:port] for IPv4 hostnames and DNS names.
131  *
132  * Native IPv6 addresses must be enclosed in square brackets, since
133  * otherwise there is an ambiguity with the port separator `:'.
134  * The 'port' part is always considered to be a number; if absent,
135  * it is set to -1, to indicate that a default port is to be used.
136  *
137  * The following are valid examples:
138  * - 10.10.1.1
139  * - 10.10.1.2:8000
140  * - localhost
141  * - localhost:8001
142  * - [::1]:8000
143  * - [badc0de::1]
144  *
145  * \param url     The URL string to take apart.
146  * \param host    To return the copied host part of \a url.
147  * \param hostlen The maximum length of \a host.
148  * \param port    To return the port number (if any) of \a url.
149  *
150  * \return Pointer to \a host, or \p NULL if failed.  If \p NULL is returned,
151  * \a host and \a port are undefined. If no port number was present in \a url,
152  * \a port is set to -1.
153  *
154  * \sa RFC 3986, 3.2.2/3.2.3
155  */
156 char *parse_url(const char *url,
157                 char    *host, ssize_t hostlen,
158                 int32_t *port)
159 {
160         const char *o = url;
161         char *c = host, *end = c + (hostlen - 1);
162
163         *port = -1;
164
165         if (o == NULL || hostlen < 1)
166                 goto failed;
167
168         if (*o == '[') {
169                 for (++o; (*c = *o == ']' ? '\0' : *o); c++, o++)
170                         if (c == end)
171                                 goto failed;
172
173                 if (*o++ != ']' || (*o != '\0' && *o != ':'))
174                         goto failed;
175         } else {
176                 for (; (*c = *o == ':'? '\0' : *o); c++, o++) {
177                         if (c == end && o[1])
178                                 goto failed;
179                 }
180         }
181
182         if (*o == ':')
183                 if (para_atoi32(++o, port) < 0 ||
184                     *port < 0 || *port > 0xffff)
185                         goto failed;
186         if (host_string_ok(host))
187                 return host;
188 failed:
189         *host = '\0';
190         return NULL;
191 }
192
193 /**
194  * Stringify port number, resolve into service name where defined.
195  * \param port 2-byte port number, in host-byte-order.
196  * \param transport Transport protocol name (e.g. "udp", "tcp"), or NULL.
197  * \return Pointer to static result buffer.
198  *
199  * \sa getservent(3), services(5), nsswitch.conf(5)
200  */
201 const char *stringify_port(int port, const char *transport)
202 {
203         static char service[NI_MAXSERV];
204
205         if (port < 0 || port > 0xFFFF) {
206                 snprintf(service, sizeof(service), "undefined (%d)", port);
207         } else {
208                 struct servent *se = getservbyport(htons(port), transport);
209
210                 if (se == NULL)
211                         snprintf(service, sizeof(service), "%u", port);
212                 else
213                         snprintf(service, sizeof(service), "%s", se->s_name);
214         }
215         return service;
216 }
217
218 /**
219  * Determine the socket type for a given layer-4 protocol.
220  *
221  * \param l4type The symbolic name of the transport-layer protocol.
222  *
223  * \sa ip(7), socket(2)
224  */
225 static inline int sock_type(const unsigned l4type)
226 {
227         switch (l4type) {
228         case IPPROTO_UDP:       return SOCK_DGRAM;
229         case IPPROTO_TCP:       return SOCK_STREAM;
230         case IPPROTO_DCCP:      return SOCK_DCCP;
231         }
232         return -1;              /* not supported here */
233 }
234
235 /**
236  * Pretty-print transport-layer name.
237  */
238 static const char *layer4_name(const unsigned l4type)
239 {
240         switch (l4type) {
241         case IPPROTO_UDP:       return "UDP";
242         case IPPROTO_TCP:       return "TCP";
243         case IPPROTO_DCCP:      return "DCCP";
244         }
245         return "UNKNOWN PROTOCOL";
246 }
247
248 /**
249  * Flowopts: Transport-layer independent encapsulation of socket options.
250  *
251  * These collect individual socket options into a queue, which is disposed of
252  * directly after makesock(). The 'pre_conn_opt' structure is for internal use
253  * only and should not be visible elsewhere.
254  *
255  * \sa setsockopt(2), makesock()
256  */
257 struct pre_conn_opt {
258         int             sock_level;     /**< Second argument to setsockopt() */
259         int             sock_option;    /**< Third argument to setsockopt()  */
260         char            *opt_name;      /**< Stringified \a sock_option      */
261         void            *opt_val;       /**< Fourth argument to setsockopt() */
262         socklen_t       opt_len;        /**< Fifth argument to setsockopt()  */
263
264         struct list_head node;          /**< FIFO, as sockopt order matters. */
265 };
266
267 /** FIFO list of pre-connection socket options to be set */
268 struct flowopts {
269         struct list_head sockopts;
270 };
271
272 /**
273  * Allocate and initialize a flowopt queue.
274  *
275  * \return A new structure to be passed to \ref flowopt_add(). It is
276  * automatically deallocated in \ref makesock().
277  */
278 struct flowopts *flowopt_new(void)
279 {
280         struct flowopts *new = para_malloc(sizeof(*new));
281
282         INIT_LIST_HEAD(&new->sockopts);
283         return new;
284 }
285
286 /**
287  * Append new socket option to flowopt queue.
288  *
289  * \param fo   The flowopt queue to append to.
290  * \param lev  Level at which \a opt resides.
291  * \param opt  New option to add.
292  * \param name Stringified name of \a opt.
293  * \param val  The value to set \a opt to.
294  * \param len  Length of \a val.
295  *
296  *  \sa setsockopt(2)
297  */
298 void flowopt_add(struct flowopts *fo, int lev, int opt,
299                 const char *name, const void *val, int len)
300 {
301         struct pre_conn_opt *new = para_malloc(sizeof(*new));
302
303         new->sock_option = opt;
304         new->sock_level  = lev;
305         new->opt_name    = para_strdup(name);
306
307         if (val == NULL) {
308                 new->opt_val = NULL;
309                 new->opt_len = 0;
310         } else {
311                 new->opt_val = para_malloc(len);
312                 new->opt_len = len;
313                 memcpy(new->opt_val, val, len);
314         }
315
316         list_add_tail(&new->node, &fo->sockopts);
317 }
318
319 /** Set the entire bunch of pre-connection options at once. */
320 static void flowopt_setopts(int sockfd, struct flowopts *fo)
321 {
322         struct pre_conn_opt *pc;
323
324         if (fo == NULL)
325                 return;
326
327         list_for_each_entry(pc, &fo->sockopts, node)
328                 if (setsockopt(sockfd, pc->sock_level, pc->sock_option,
329                                        pc->opt_val, pc->opt_len) < 0) {
330                         PARA_EMERG_LOG("Can not set %s socket option: %s",
331                                        pc->opt_name, strerror(errno));
332                         exit(EXIT_FAILURE);
333                 }
334 }
335
336 static void flowopt_cleanup(struct flowopts *fo)
337 {
338         struct pre_conn_opt *cur, *next;
339
340         if (fo == NULL)
341                 return;
342
343         list_for_each_entry_safe(cur, next, &fo->sockopts, node) {
344                 free(cur->opt_name);
345                 free(cur->opt_val);
346                 free(cur);
347         }
348         free(fo);
349 }
350
351 /*
352  * Resolve an IPv4/IPv6 address.
353  *
354  * \param l4type The layer-4 type (\p IPPROTO_xxx).
355  * \param passive Whether \p AI_PASSIVE should be included as hint.
356  * \param host Remote or local hostname or IPv/6 address string.
357  * \param port_number Used to set the port in each returned address structure.
358  * \param result addrinfo structures are returned here.
359  *
360  * The interpretation of \a host depends on the value of \a passive. On a
361  * passive socket host is interpreted as an interface IPv4/6 address (can be
362  * left NULL). On an active socket, \a host is the peer DNS name or IPv4/6
363  * address to connect to.
364  *
365  * \return Standard.
366  *
367  * \sa getaddrinfo(3).
368  */
369 static int lookup_address(unsigned l4type, bool passive, const char *host,
370                 int port_number, struct addrinfo **result)
371 {
372         int ret;
373         char port[6]; /* port number has at most 5 digits */
374         struct addrinfo *addr = NULL, hints;
375
376         *result = NULL;
377         sprintf(port, "%u", port_number & 0xffff);
378         /* Set up address hint structure */
379         memset(&hints, 0, sizeof(hints));
380         hints.ai_family = AF_UNSPEC;
381         hints.ai_socktype = sock_type(l4type);
382         /*
383          * getaddrinfo does not support SOCK_DCCP, so for the sake of lookup
384          * (and only then) pretend to be UDP.
385          */
386         if (l4type == IPPROTO_DCCP)
387                 hints.ai_socktype = SOCK_DGRAM;
388         /* only use addresses available on the host */
389         hints.ai_flags = AI_ADDRCONFIG;
390         if (passive && host == NULL)
391                 hints.ai_flags |= AI_PASSIVE;
392         /* Obtain local/remote address information */
393         ret = getaddrinfo(host, port, &hints, &addr);
394         if (ret != 0) {
395                 PARA_ERROR_LOG("can not resolve %s address %s#%s: %s\n",
396                         layer4_name(l4type),
397                         host? host : (passive? "[loopback]" : "[localhost]"),
398                         port, gai_strerror(ret));
399                 return -E_ADDRESS_LOOKUP;
400         }
401         *result = addr;
402         return 1;
403 }
404
405 /*
406  * Create an active or passive socket.
407  *
408  * \param l4type \p IPPROTO_TCP, \p IPPROTO_UDP, or \p IPPROTO_DCCP.
409  * \param passive Whether to call bind(2) or connect(2).
410  * \param ai Address information as obtained from \ref lookup_address().
411  * \param fo Socket options to be set before making the connection.
412  *
413  * bind(2) is called on passive sockets, and connect(2) on active sockets. The
414  * algorithm tries all possible address combinations until it succeeds. If \a
415  * fo is supplied, options are set and cleanup is performed.
416  *
417  * \return File descriptor on success, \p E_MAKESOCK on errors.
418  *
419  * \sa \ref lookup_address(), \ref makesock(), ip(7), ipv6(7), bind(2),
420  * connect(2).
421  */
422 static int makesock_addrinfo(unsigned l4type, bool passive, struct addrinfo *ai,
423                 struct flowopts *fo)
424 {
425         struct addrinfo *local, *remote, *src = NULL, *dst = NULL;
426         int ret = -E_MAKESOCK, on = 1, sockfd = -1;
427
428         if (passive) {
429                 local = ai;
430                 remote = NULL;
431         } else {
432                 local = NULL;
433                 remote = ai;
434         }
435
436         /* Iterate over all src/dst combination, exhausting dst first */
437         for (src = local, dst = remote; src != NULL || dst != NULL; /* no op */ ) {
438                 if (src && dst && src->ai_family == AF_INET
439                                 && dst->ai_family == AF_INET6)
440                         goto get_next_dst; /* v4 -> v6 is not possible */
441
442                 ret = socket(src ? src->ai_family : dst->ai_family,
443                         sock_type(l4type), l4type);
444                 if (ret < 0)
445                         goto get_next_dst;
446                 sockfd = ret;
447                 /*
448                  * Reuse the address on passive sockets to avoid failure on
449                  * restart (protocols using listen()) and when creating
450                  * multiple listener instances (UDP multicast).
451                  */
452                 if (passive && setsockopt(sockfd, SOL_SOCKET, SO_REUSEADDR,
453                                                   &on, sizeof(on)) == -1) {
454                         ret = -ERRNO_TO_PARA_ERROR(errno);
455                         close(sockfd);
456                         PARA_ERROR_LOG("can not set SO_REUSEADDR: %s\n",
457                                 para_strerror(-ret));
458                         break;
459                 }
460                 flowopt_setopts(sockfd, fo);
461
462                 if (src) {
463                         if (bind(sockfd, src->ai_addr, src->ai_addrlen) < 0) {
464                                 close(sockfd);
465                                 goto get_next_src;
466                         }
467                         if (!dst) /* bind-only completed successfully */
468                                 break;
469                 }
470
471                 if (dst && connect(sockfd, dst->ai_addr, dst->ai_addrlen) == 0)
472                         break; /* connection completed successfully */
473                 close(sockfd);
474 get_next_dst:
475                 if (dst && (dst = dst->ai_next))
476                         continue;
477 get_next_src:
478                 if (src && (src = src->ai_next)) /* restart inner loop */
479                         dst = remote;
480         }
481         if (src == NULL && dst == NULL)
482                 return ret < 0? ret : -E_MAKESOCK;
483         return sockfd;
484 }
485
486 /**
487  * Resolve IPv4/IPv6 address and create a ready-to-use active or passive socket.
488  *
489  * \param l4type The layer-4 type (\p IPPROTO_xxx).
490  * \param passive Whether this is a passive or active socket.
491  * \param host Passed to \ref lookup_address().
492  * \param port_number Passed to \ref lookup_address().
493  * \param fo Passed to \ref makesock_addrinfo().
494  *
495  * This creates a ready-made IPv4/v6 socket structure after looking up the
496  * necessary parameters. The function first calls \ref lookup_address() and
497  * passes the address information to makesock_addrinfo() to create and
498  * initialize the socket.
499  *
500  * \return The newly created file descriptor on success, a negative error code
501  * on failure.
502  *
503  * \sa \ref lookup_address(), \ref makesock_addrinfo().
504  */
505 int makesock(unsigned l4type, bool passive, const char *host, uint16_t port_number,
506                 struct flowopts *fo)
507 {
508         struct addrinfo *ai;
509         int ret = lookup_address(l4type, passive, host, port_number, &ai);
510
511         if (ret >= 0)
512                 ret = makesock_addrinfo(l4type, passive, ai, fo);
513         if (ai)
514                 freeaddrinfo(ai);
515         flowopt_cleanup(fo);
516         if (ret < 0) {
517                 PARA_ERROR_LOG("can not create %s socket %s#%d.\n",
518                 layer4_name(l4type), host? host : (passive?
519                 "[loopback]" : "[localhost]"), port_number);
520         }
521         return ret;
522 }
523
524 /**
525  * Create a passive / listening socket.
526  *
527  * \param l4type The transport-layer type (\p IPPROTO_xxx).
528  * \param port The decimal port number to listen on.
529  * \param fo Flowopts (if any) to set before starting to listen.
530  *
531  * \return Positive integer (socket descriptor) on success, negative value
532  * otherwise.
533  *
534  * \sa makesock(), ip(7), ipv6(7), bind(2), listen(2).
535  */
536 int para_listen(unsigned l4type, uint16_t port, struct flowopts *fo)
537 {
538         int ret, fd = makesock(l4type, 1, NULL, port, fo);
539
540         if (fd > 0) {
541                 ret = listen(fd, BACKLOG);
542                 if (ret < 0) {
543                         ret = errno;
544                         close(fd);
545                         return -ERRNO_TO_PARA_ERROR(ret);
546                 }
547                 PARA_INFO_LOG("listening on %s port %u, fd %d\n",
548                         layer4_name(l4type), port, fd);
549         }
550         return fd;
551 }
552
553 /**
554  * Determine IPv4/v6 socket address length.
555  * \param sa Container of IPv4 or IPv6 address.
556  * \return Address-family dependent address length.
557  */
558 static socklen_t salen(const struct sockaddr *sa)
559 {
560         assert(sa->sa_family == AF_INET || sa->sa_family == AF_INET6);
561
562         return sa->sa_family == AF_INET6
563                 ? sizeof(struct sockaddr_in6)
564                 : sizeof(struct sockaddr_in);
565 }
566
567 /** True if @ss holds a v6-mapped-v4 address (RFC 4291, 2.5.5.2) */
568 static bool SS_IS_ADDR_V4MAPPED(const struct sockaddr_storage *ss)
569 {
570         const struct sockaddr_in6 *ia6 = (const struct sockaddr_in6 *)ss;
571
572         return ss->ss_family == AF_INET6 && IN6_IS_ADDR_V4MAPPED(&ia6->sin6_addr);
573 }
574
575 /**
576  * Process IPv4/v6 address, turn v6-mapped-v4 address into normal IPv4 address.
577  * \param ss Container of IPv4/6 address.
578  * \return Pointer to normalized address (may be static storage).
579  *
580  * \sa RFC 3493
581  */
582 static const struct sockaddr *
583 normalize_ip_address(const struct sockaddr_storage *ss)
584 {
585         assert(ss->ss_family == AF_INET || ss->ss_family == AF_INET6);
586
587         if (SS_IS_ADDR_V4MAPPED(ss)) {
588                 const struct sockaddr_in6 *ia6 = (const struct sockaddr_in6 *)ss;
589                 static struct sockaddr_in ia;
590
591                 ia.sin_family = AF_INET;
592                 ia.sin_port   = ia6->sin6_port;
593                 memcpy(&ia.sin_addr.s_addr, &(ia6->sin6_addr.s6_addr[12]), 4);
594                 return (const struct sockaddr *)&ia;
595         }
596         return (const struct sockaddr *)ss;
597 }
598
599 /**
600  * Generic/fallback MTU values
601  *
602  * These are taken from RFC 1122, RFC 2460, and RFC 5405.
603  * - RFC 1122, 3.3.3 defines EMTU_S ("Effective MTU for sending") and recommends
604  *   to use an EMTU_S size of of 576 bytes if the IPv4 path MTU is unknown;
605  * - RFC 2460, 5. requires a minimum IPv6 MTU of 1280 bytes;
606  * - RFC 5405, 3.2 recommends that if path MTU discovery is not done,
607  *   UDP senders should use the respective minimum values of EMTU_S.
608  */
609 static inline int generic_mtu(const int af_type)
610 {
611         return af_type == AF_INET6 ? 1280 : 576;
612 }
613
614 /** Crude approximation of IP header overhead - neglecting options. */
615 static inline int estimated_header_overhead(const int af_type)
616 {
617         return af_type == AF_INET6 ? 40 : 20;
618 }
619
620 /**
621  * Get the maximum transport-layer message size (MMS_S).
622  *
623  * \param sockfd The socket file descriptor.
624  *
625  * The socket must be connected. See RFC 1122, 3.3.3. If the protocol familiy
626  * could not be determined, \p AF_INET is assumed.
627  *
628  * \return The maximum message size of the address family type.
629  */
630 int generic_max_transport_msg_size(int sockfd)
631 {
632         struct sockaddr_storage ss;
633         socklen_t sslen = sizeof(ss);
634         int af_type = AF_INET;
635
636         if (getpeername(sockfd, (struct sockaddr *)&ss, &sslen) < 0) {
637                 PARA_ERROR_LOG("can not determine remote address type: %s\n",
638                                 strerror(errno));
639         } else if (!SS_IS_ADDR_V4MAPPED(&ss)) {
640                 af_type = ss.ss_family;
641         }
642         return generic_mtu(af_type) - estimated_header_overhead(af_type);
643 }
644
645 /**
646  * Look up the local or remote side of a connected socket structure.
647  *
648  * \param fd The socket descriptor of the connected socket.
649  * \param getname Either \p getsockname() for local, or \p getpeername() for
650  * remote side.
651  *
652  * \return A static character string identifying hostname and port of the
653  * chosen side in numeric host:port format.
654  *
655  * \sa getsockname(2), getpeername(2), parse_url(), getnameinfo(3),
656  * services(5), nsswitch.conf(5).
657  */
658 static char *__get_sock_name(int fd, typeof(getsockname) getname)
659 {
660         struct sockaddr_storage ss;
661         const struct sockaddr *sa;
662         socklen_t sslen = sizeof(ss);
663         char hbuf[NI_MAXHOST], sbuf[NI_MAXSERV];
664         static char output[sizeof(hbuf) + sizeof(sbuf) + 4];
665         int ret;
666
667         if (getname(fd, (struct sockaddr *)&ss, &sslen) < 0) {
668                 PARA_ERROR_LOG("can not determine address from fd %d: %s\n",
669                         fd, strerror(errno));
670                 snprintf(output, sizeof(output), "(unknown)");
671                 return output;
672         }
673         sa = normalize_ip_address(&ss);
674         ret = getnameinfo(sa, salen(sa), hbuf, sizeof(hbuf), sbuf,
675                 sizeof(sbuf), NI_NUMERICHOST | NI_NUMERICSERV);
676         if (ret) {
677                 PARA_WARNING_LOG("hostname lookup error (%s).\n",
678                         gai_strerror(ret));
679                 snprintf(output, sizeof(output), "(lookup error)");
680         } else if (sa->sa_family == AF_INET6)
681                 snprintf(output, sizeof(output), "[%s]:%s", hbuf, sbuf);
682         else
683                 snprintf(output, sizeof(output), "%s:%s", hbuf, sbuf);
684         return output;
685 }
686
687 /**
688  * Look up the local side of a connected socket structure.
689  *
690  * \param sockfd The file descriptor of the socket.
691  *
692  * \return A pointer to a static buffer containing hostname an port. This
693  * buffer must not be freed by the caller.
694  *
695  * \sa remote_name().
696  */
697 char *local_name(int sockfd)
698 {
699         return __get_sock_name(sockfd, getsockname);
700 }
701
702 /**
703  * Look up the remote side of a connected socket structure.
704  *
705  * \param sockfd The file descriptor of the socket.
706  *
707  * \return Analogous to the return value of \ref local_name() but for the
708  * remote side.
709  *
710  * \sa local_name().
711  */
712 char *remote_name(int sockfd)
713 {
714         return __get_sock_name(sockfd, getpeername);
715 }
716
717 /**
718  * Extract IPv4 or IPv6-mapped-IPv4 address from sockaddr_storage.
719  *
720  * \param ss Container of IPv4/6 address.
721  * \param ia Extracted IPv4 address (different from 0) or 0 if unsuccessful.
722  *
723  * \sa RFC 3493.
724  */
725 void extract_v4_addr(const struct sockaddr_storage *ss, struct in_addr *ia)
726 {
727         const struct sockaddr *sa = normalize_ip_address(ss);
728
729         memset(ia, 0, sizeof(*ia));
730         if (sa->sa_family == AF_INET)
731                 *ia = ((struct sockaddr_in *)sa)->sin_addr;
732 }
733
734 /**
735  * Receive data from a file descriptor.
736  *
737  * \param fd The file descriptor.
738  * \param buf The buffer to write the data to.
739  * \param size The size of \a buf.
740  *
741  * Receive at most \a size bytes from file descriptor \a fd.
742  *
743  * \return The number of bytes received on success, negative on errors, zero if
744  * the peer has performed an orderly shutdown.
745  *
746  * \sa recv(2).
747  */
748 __must_check int recv_bin_buffer(int fd, char *buf, size_t size)
749 {
750         ssize_t n;
751
752         n = recv(fd, buf, size, 0);
753         if (n == -1)
754                 return -ERRNO_TO_PARA_ERROR(errno);
755         return n;
756 }
757
758 /**
759  * Receive and write terminating NULL byte.
760  *
761  * \param fd The file descriptor.
762  * \param buf The buffer to write the data to.
763  * \param size The size of \a buf.
764  *
765  * Read at most \a size - 1 bytes from file descriptor \a fd and
766  * write a NULL byte at the end of the received data.
767  *
768  * \return The return value of the underlying call to \a recv_bin_buffer().
769  *
770  * \sa recv_bin_buffer()
771  */
772 int recv_buffer(int fd, char *buf, size_t size)
773 {
774         int n;
775
776         assert(size);
777         n = recv_bin_buffer(fd, buf, size - 1);
778         if (n >= 0)
779                 buf[n] = '\0';
780         else
781                 *buf = '\0';
782         return n;
783 }
784
785 /**
786  * Wrapper around the accept system call.
787  *
788  * \param fd The listening socket.
789  * \param rfds An optional fd_set pointer.
790  * \param addr Structure which is filled in with the address of the peer socket.
791  * \param size Should contain the size of the structure pointed to by \a addr.
792  * \param new_fd Result pointer.
793  *
794  * Accept incoming connections on \a addr, retry if interrupted. If \a rfds is
795  * not \p NULL, return 0 if \a fd is not set in \a rfds without calling accept().
796  *
797  * \return Negative on errors, zero if no connections are present to be accepted,
798  * one otherwise.
799  *
800  * \sa accept(2).
801  */
802 int para_accept(int fd, fd_set *rfds, void *addr, socklen_t size, int *new_fd)
803 {
804         int ret;
805
806         if (rfds && !FD_ISSET(fd, rfds))
807                 return 0;
808         do
809                 ret = accept(fd, (struct sockaddr *) addr, &size);
810         while (ret < 0 && errno == EINTR);
811
812         if (ret >= 0) {
813                 *new_fd = ret;
814                 return 1;
815         }
816         if (errno == EAGAIN || errno == EWOULDBLOCK)
817                 return 0;
818         return -ERRNO_TO_PARA_ERROR(errno);
819 }
820
821 /**
822  * Probe the list of DCCP CCIDs configured on this host.
823  * \param ccid_array Pointer to return statically allocated array in.
824  * \return Number of elements returned in \a ccid_array or error.
825  *
826  * NB: This feature is only available on Linux > 2.6.30; on older kernels
827  * ENOPROTOOPT ("Protocol not available") will be returned.
828  */
829 int dccp_available_ccids(uint8_t **ccid_array)
830 {
831         static uint8_t ccids[DCCP_MAX_HOST_CCIDS];
832         socklen_t nccids = sizeof(ccids);
833         int ret, fd;
834
835         ret = fd = makesock(IPPROTO_DCCP, 1, NULL, 0, NULL);
836         if (ret < 0)
837                 return ret;
838
839         if (getsockopt(fd, SOL_DCCP, DCCP_SOCKOPT_AVAILABLE_CCIDS,
840                                                 ccids, &nccids) < 0) {
841                 ret = errno;
842                 close(fd);
843                 PARA_ERROR_LOG("No DCCP_SOCKOPT_AVAILABLE_CCIDS: %s\n",
844                                 strerror(ret));
845                 return -ERRNO_TO_PARA_ERROR(ret);
846         }
847
848         close(fd);
849         *ccid_array = ccids;
850         return nccids;
851 }
852
853 /**
854  * Prepare a structure for \p AF_UNIX socket addresses.
855  *
856  * \param u Pointer to the struct to be prepared.
857  * \param name The socket pathname.
858  *
859  * This just copies \a name to the sun_path component of \a u.
860  *
861  * \return Positive on success, \p -E_NAME_TOO_LONG if \a name is longer
862  * than \p UNIX_PATH_MAX.
863  */
864 static int init_unix_addr(struct sockaddr_un *u, const char *name)
865 {
866         if (strlen(name) >= UNIX_PATH_MAX)
867                 return -E_NAME_TOO_LONG;
868         memset(u->sun_path, 0, UNIX_PATH_MAX);
869         u->sun_family = PF_UNIX;
870         strcpy(u->sun_path, name);
871         return 1;
872 }
873
874 /**
875  * Prepare, create, and bind a socket for local communication.
876  *
877  * \param name The socket pathname.
878  * \param unix_addr Pointer to the \p AF_UNIX socket structure.
879  * \param mode The desired mode of the socket.
880  *
881  * This function creates a local socket for sequenced, reliable,
882  * two-way, connection-based byte streams.
883  *
884  * \return The file descriptor, on success, negative on errors.
885  *
886  * \sa socket(2)
887  * \sa bind(2)
888  * \sa chmod(2)
889  */
890 int create_local_socket(const char *name, struct sockaddr_un *unix_addr,
891                 mode_t mode)
892 {
893         int fd, ret;
894
895         ret = init_unix_addr(unix_addr, name);
896         if (ret < 0)
897                 return ret;
898         ret = socket(PF_UNIX, SOCK_STREAM, 0);
899         if (ret < 0)
900                 return -ERRNO_TO_PARA_ERROR(errno);
901         fd = ret;
902         ret = bind(fd, (struct sockaddr *) unix_addr, UNIX_PATH_MAX);
903         if (ret < 0) {
904                 ret = -ERRNO_TO_PARA_ERROR(errno);
905                 goto err;
906         }
907         ret = -E_CHMOD;
908         if (chmod(name, mode) < 0)
909                 goto err;
910         return fd;
911 err:
912         close(fd);
913         return ret;
914 }
915
916 /**
917  * Prepare, create, and connect to a Unix domain socket for local communication.
918  *
919  * \param name The socket pathname.
920  *
921  * This function creates a local socket for sequenced, reliable, two-way,
922  * connection-based byte streams.
923  *
924  * \return The file descriptor of the connected socket on success, negative on
925  * errors.
926  *
927  * \sa create_local_socket(), unix(7), connect(2).
928  */
929 int connect_local_socket(const char *name)
930 {
931         struct sockaddr_un unix_addr;
932         int fd, ret;
933
934         PARA_DEBUG_LOG("connecting to %s\n", name);
935         ret = init_unix_addr(&unix_addr, name);
936         if (ret < 0)
937                 return ret;
938         fd = socket(PF_UNIX, SOCK_STREAM, 0);
939         if (fd < 0)
940                 return -ERRNO_TO_PARA_ERROR(errno);
941         if (connect(fd, (struct sockaddr *)&unix_addr, sizeof(unix_addr)) == -1) {
942                 ret = -ERRNO_TO_PARA_ERROR(errno);
943                 goto err;
944         }
945         return fd;
946 err:
947         close(fd);
948         return ret;
949 }
950
951 #ifndef HAVE_UCRED
952 ssize_t send_cred_buffer(int sock, char *buf)
953 {
954         return write_buffer(sock, buf);
955 }
956 int recv_cred_buffer(int fd, char *buf, size_t size)
957 {
958         return recv_buffer(fd, buf, size) > 0? 1 : -E_RECVMSG;
959 }
960 #else /* HAVE_UCRED */
961 /**
962  * Send \p NULL-terminated buffer and Unix credentials of the current process.
963  *
964  * \param sock The socket file descriptor.
965  * \param buf The buffer to be sent.
966  *
967  * \return On success, this call returns the number of characters sent.  On
968  * error, \p -E_SENDMSG is returned.
969  *
970  * \sa sendmsg(2), okir's Black Hats Manual.
971  */
972 ssize_t send_cred_buffer(int sock, char *buf)
973 {
974         char control[sizeof(struct cmsghdr) + sizeof(struct ucred)];
975         struct msghdr msg;
976         struct cmsghdr *cmsg;
977         static struct iovec iov;
978         struct ucred c;
979         int ret;
980
981         /* Response data */
982         iov.iov_base = buf;
983         iov.iov_len  = strlen(buf);
984         c.pid = getpid();
985         c.uid = getuid();
986         c.gid = getgid();
987         /* compose the message */
988         memset(&msg, 0, sizeof(msg));
989         msg.msg_iov = &iov;
990         msg.msg_iovlen = 1;
991         msg.msg_control = control;
992         msg.msg_controllen = sizeof(control);
993         /* attach the ucred struct */
994         cmsg = CMSG_FIRSTHDR(&msg);
995         cmsg->cmsg_level = SOL_SOCKET;
996         cmsg->cmsg_type = SCM_CREDENTIALS;
997         cmsg->cmsg_len = CMSG_LEN(sizeof(struct ucred));
998         *(struct ucred *)CMSG_DATA(cmsg) = c;
999         msg.msg_controllen = cmsg->cmsg_len;
1000         ret = sendmsg(sock, &msg, 0);
1001         if (ret  < 0)
1002                 ret = -E_SENDMSG;
1003         return ret;
1004 }
1005
1006 static void dispose_fds(int *fds, unsigned num)
1007 {
1008         int i;
1009
1010         for (i = 0; i < num; i++)
1011                 close(fds[i]);
1012 }
1013
1014 /**
1015  * Receive a buffer and the Unix credentials of the sending process.
1016  *
1017  * \param fd the socket file descriptor.
1018  * \param buf the buffer to store the message.
1019  * \param size the size of \a buffer.
1020  *
1021  * \return negative on errors, the user id on success.
1022  *
1023  * \sa recvmsg(2), okir's Black Hats Manual.
1024  */
1025 int recv_cred_buffer(int fd, char *buf, size_t size)
1026 {
1027         char control[255];
1028         struct msghdr msg;
1029         struct cmsghdr *cmsg;
1030         struct iovec iov;
1031         int result = 0;
1032         int yes = 1;
1033         struct ucred cred;
1034
1035         setsockopt(fd, SOL_SOCKET, SO_PASSCRED, &yes, sizeof(int));
1036         memset(&msg, 0, sizeof(msg));
1037         memset(buf, 0, size);
1038         iov.iov_base = buf;
1039         iov.iov_len = size;
1040         msg.msg_iov = &iov;
1041         msg.msg_iovlen = 1;
1042         msg.msg_control = control;
1043         msg.msg_controllen = sizeof(control);
1044         if (recvmsg(fd, &msg, 0) < 0)
1045                 return -E_RECVMSG;
1046         result = -E_SCM_CREDENTIALS;
1047         cmsg = CMSG_FIRSTHDR(&msg);
1048         while (cmsg) {
1049                 if (cmsg->cmsg_level == SOL_SOCKET && cmsg->cmsg_type
1050                                 == SCM_CREDENTIALS) {
1051                         memcpy(&cred, CMSG_DATA(cmsg), sizeof(struct ucred));
1052                         result = cred.uid;
1053                 } else
1054                         if (cmsg->cmsg_level == SOL_SOCKET
1055                                         && cmsg->cmsg_type == SCM_RIGHTS) {
1056                                 dispose_fds((int *) CMSG_DATA(cmsg),
1057                                         (cmsg->cmsg_len - CMSG_LEN(0))
1058                                         / sizeof(int));
1059                         }
1060                 cmsg = CMSG_NXTHDR(&msg, cmsg);
1061         }
1062         return result;
1063 }
1064 #endif /* HAVE_UCRED */