/*
   drbd_bitmap.c

   This file is part of DRBD by Philipp Reisner and Lars Ellenberg.

   Copyright (C) 2004-2008, LINBIT Information Technologies GmbH.
   Copyright (C) 2004-2008, Philipp Reisner <philipp.reisner@linbit.com>.
   Copyright (C) 2004-2008, Lars Ellenberg <lars.ellenberg@linbit.com>.

   drbd is free software; you can redistribute it and/or modify
   it under the terms of the GNU General Public License as published by
   the Free Software Foundation; either version 2, or (at your option)
   any later version.

   drbd is distributed in the hope that it will be useful,
   but WITHOUT ANY WARRANTY; without even the implied warranty of
   MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
   GNU General Public License for more details.

   You should have received a copy of the GNU General Public License
   along with drbd; see the file COPYING.  If not, write to
   the Free Software Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.
 */

#include <linux/bitops.h>
#include <linux/vmalloc.h>
#include <linux/string.h>
#include <linux/drbd.h>
#include <linux/slab.h>
#include <asm/kmap_types.h>

#include "drbd_int.h"


/* OPAQUE outside this file!
 * interface defined in drbd_int.h

 * convention:
 * function name drbd_bm_... => used elsewhere, "public".
 * function name      bm_... => internal to implementation, "private".
 */


/*
 * LIMITATIONS:
 * We want to support >= peta byte of backend storage, while for now still using
 * a granularity of one bit per 4KiB of storage.
 * 1 << 50		bytes backend storage (1 PiB)
 * 1 << (50 - 12)	bits needed
 *	38 --> we need u64 to index and count bits
 * 1 << (38 - 3)	bitmap bytes needed
 *	35 --> we still need u64 to index and count bytes
 *			(that's 32 GiB of bitmap for 1 PiB storage)
 * 1 << (35 - 2)	32bit longs needed
 *	33 --> we'd even need u64 to index and count 32bit long words.
 * 1 << (35 - 3)	64bit longs needed
 *	32 --> we could get away with a 32bit unsigned int to index and count
 *	64bit long words, but I rather stay with unsigned long for now.
 *	We probably should neither count nor point to bytes or long words
 *	directly, but either by bitnumber, or by page index and offset.
 * 1 << (35 - 12)
 *	22 --> we need that much 4KiB pages of bitmap.
 *	1 << (22 + 3) --> on a 64bit arch,
 *	we need 32 MiB to store the array of page pointers.
 *
 * Because I'm lazy, and because the resulting patch was too large, too ugly
 * and still incomplete, on 32bit we still "only" support 16 TiB (minus some),
 * (1 << 32) bits * 4k storage.
 *

 * bitmap storage and IO:
 *	Bitmap is stored little endian on disk, and is kept little endian in
 *	core memory. Currently we still hold the full bitmap in core as long
 *	as we are "attached" to a local disk, which at 32 GiB for 1PiB storage
 *	seems excessive.
 *
 *	We plan to reduce the amount of in-core bitmap pages by paging them in
 *	and out against their on-disk location as necessary, but need to make
 *	sure we don't cause too much meta data IO, and must not deadlock in
 *	tight memory situations. This needs some more work.
 */

/*
 * NOTE
 *  Access to the *bm_pages is protected by bm_lock.
 *  It is safe to read the other members within the lock.
 *
 *  drbd_bm_set_bits is called from bio_endio callbacks,
 *  We may be called with irq already disabled,
 *  so we need spin_lock_irqsave().
 *  And we need the kmap_atomic.
 */
struct drbd_bitmap {
	struct page **bm_pages;
	spinlock_t bm_lock;

	/* see LIMITATIONS: above */

	unsigned long bm_set;       /* nr of set bits; THINK maybe atomic_t? */
	unsigned long bm_bits;
	size_t   bm_words;
	size_t   bm_number_of_pages;
	sector_t bm_dev_capacity;
	struct mutex bm_change; /* serializes resize operations */

	wait_queue_head_t bm_io_wait; /* used to serialize IO of single pages */

	enum bm_flag bm_flags;

	/* debugging aid, in case we are still racy somewhere */
	char          *bm_why;
	struct task_struct *bm_task;
};

#define bm_print_lock_info(m) __bm_print_lock_info(m, __func__)
static void __bm_print_lock_info(struct drbd_conf *mdev, const char *func)
{
	struct drbd_bitmap *b = mdev->bitmap;
	if (!__ratelimit(&drbd_ratelimit_state))
		return;
	dev_err(DEV, "FIXME %s in %s, bitmap locked for '%s' by %s\n",
	    current == mdev->receiver.task ? "receiver" :
	    current == mdev->asender.task  ? "asender"  :
	    current == mdev->worker.task   ? "worker"   : current->comm,
	    func, b->bm_why ?: "?",
	    b->bm_task == mdev->receiver.task ? "receiver" :
	    b->bm_task == mdev->asender.task  ? "asender"  :
	    b->bm_task == mdev->worker.task   ? "worker"   : "?");
}

void drbd_bm_lock(struct drbd_conf *mdev, char *why, enum bm_flag flags)
{
	struct drbd_bitmap *b = mdev->bitmap;
	int trylock_failed;

	if (!b) {
		dev_err(DEV, "FIXME no bitmap in drbd_bm_lock!?\n");
		return;
	}

	trylock_failed = !mutex_trylock(&b->bm_change);

	if (trylock_failed) {
		dev_warn(DEV, "%s going to '%s' but bitmap already locked for '%s' by %s\n",
		    current == mdev->receiver.task ? "receiver" :
		    current == mdev->asender.task  ? "asender"  :
		    current == mdev->worker.task   ? "worker"   : current->comm,
		    why, b->bm_why ?: "?",
		    b->bm_task == mdev->receiver.task ? "receiver" :
		    b->bm_task == mdev->asender.task  ? "asender"  :
		    b->bm_task == mdev->worker.task   ? "worker"   : "?");
		mutex_lock(&b->bm_change);
	}
	if (BM_LOCKED_MASK & b->bm_flags)
		dev_err(DEV, "FIXME bitmap already locked in bm_lock\n");
	b->bm_flags |= flags & BM_LOCKED_MASK;

	b->bm_why  = why;
	b->bm_task = current;
}

void drbd_bm_unlock(struct drbd_conf *mdev)
{
	struct drbd_bitmap *b = mdev->bitmap;
	if (!b) {
		dev_err(DEV, "FIXME no bitmap in drbd_bm_unlock!?\n");
		return;
	}

	if (!(BM_LOCKED_MASK & mdev->bitmap->bm_flags))
		dev_err(DEV, "FIXME bitmap not locked in bm_unlock\n");

	b->bm_flags &= ~BM_LOCKED_MASK;
	b->bm_why  = NULL;
	b->bm_task = NULL;
	mutex_unlock(&b->bm_change);
}

/* we store some "meta" info about our pages in page->private */
/* at a granularity of 4k storage per bitmap bit:
 * one peta byte storage: 1<<50 byte, 1<<38 * 4k storage blocks
 *  1<<38 bits,
 *  1<<23 4k bitmap pages.
 * Use 24 bits as page index, covers 2 peta byte storage
 * at a granularity of 4k per bit.
 * Used to report the failed page idx on io error from the endio handlers.
 */
#define BM_PAGE_IDX_MASK	((1UL<<24)-1)
/* this page is currently read in, or written back */
#define BM_PAGE_IO_LOCK		31
/* if there has been an IO error for this page */
#define BM_PAGE_IO_ERROR	30
/* this is to be able to intelligently skip disk IO,
 * set if bits have been set since last IO. */
#define BM_PAGE_NEED_WRITEOUT	29
/* to mark for lazy writeout once syncer cleared all clearable bits,
 * we if bits have been cleared since last IO. */
#define BM_PAGE_LAZY_WRITEOUT	28

/* store_page_idx uses non-atomic assignment. It is only used directly after
 * allocating the page.  All other bm_set_page_* and bm_clear_page_* need to
 * use atomic bit manipulation, as set_out_of_sync (and therefore bitmap
 * changes) may happen from various contexts, and wait_on_bit/wake_up_bit
 * requires it all to be atomic as well. */
static void bm_store_page_idx(struct page *page, unsigned long idx)
{
	BUG_ON(0 != (idx & ~BM_PAGE_IDX_MASK));
	page_private(page) |= idx;
}

static unsigned long bm_page_to_idx(struct page *page)
{
	return page_private(page) & BM_PAGE_IDX_MASK;
}

/* As is very unlikely that the same page is under IO from more than one
 * context, we can get away with a bit per page and one wait queue per bitmap.
 */
static void bm_page_lock_io(struct drbd_conf *mdev, int page_nr)
{
	struct drbd_bitmap *b = mdev->bitmap;
	void *addr = &page_private(b->bm_pages[page_nr]);
	wait_event(b->bm_io_wait, !test_and_set_bit(BM_PAGE_IO_LOCK, addr));
}

static void bm_page_unlock_io(struct drbd_conf *mdev, int page_nr)
{
	struct drbd_bitmap *b = mdev->bitmap;
	void *addr = &page_private(b->bm_pages[page_nr]);
	clear_bit(BM_PAGE_IO_LOCK, addr);
	smp_mb__after_clear_bit();
	wake_up(&mdev->bitmap->bm_io_wait);
}

/* set _before_ submit_io, so it may be reset due to being changed
 * while this page is in flight... will get submitted later again */
static void bm_set_page_unchanged(struct page *page)
{
	/* use cmpxchg? */
	clear_bit(BM_PAGE_NEED_WRITEOUT, &page_private(page));
	clear_bit(BM_PAGE_LAZY_WRITEOUT, &page_private(page));
}

static void bm_set_page_need_writeout(struct page *page)
{
	set_bit(BM_PAGE_NEED_WRITEOUT, &page_private(page));
}

static int bm_test_page_unchanged(struct page *page)
{
	volatile const unsigned long *addr = &page_private(page);
	return (*addr & ((1UL<<BM_PAGE_NEED_WRITEOUT)|(1UL<<BM_PAGE_LAZY_WRITEOUT))) == 0;
}

static void bm_set_page_io_err(struct page *page)
{
	set_bit(BM_PAGE_IO_ERROR, &page_private(page));
}

static void bm_clear_page_io_err(struct page *page)
{
	clear_bit(BM_PAGE_IO_ERROR, &page_private(page));
}

static void bm_set_page_lazy_writeout(struct page *page)
{
	set_bit(BM_PAGE_LAZY_WRITEOUT, &page_private(page));
}

static int bm_test_page_lazy_writeout(struct page *page)
{
	return test_bit(BM_PAGE_LAZY_WRITEOUT, &page_private(page));
}

/* on a 32bit box, this would allow for exactly (2<<38) bits. */
static unsigned int bm_word_to_page_idx(struct drbd_bitmap *b, unsigned long long_nr)
{
	/* page_nr = (word*sizeof(long)) >> PAGE_SHIFT; */
	unsigned int page_nr = long_nr >> (PAGE_SHIFT - LN2_BPL + 3);
	BUG_ON(page_nr >= b->bm_number_of_pages);
	return page_nr;
}

static unsigned int bm_bit_to_page_idx(struct drbd_bitmap *b, u64 bitnr)
{
	/* page_nr = (bitnr/8) >> PAGE_SHIFT; */
	unsigned int page_nr = bitnr >> (PAGE_SHIFT + 3);
	BUG_ON(page_nr >= b->bm_number_of_pages);
	return page_nr;
}

static unsigned long *__bm_map_pidx(struct drbd_bitmap *b, unsigned int idx, const enum km_type km)
{
	struct page *page = b->bm_pages[idx];
	return (unsigned long *) kmap_atomic(page, km);
}

static unsigned long *bm_map_pidx(struct drbd_bitmap *b, unsigned int idx)
{
	return __bm_map_pidx(b, idx, KM_IRQ1);
}

static void __bm_unmap(unsigned long *p_addr, const enum km_type km)
{
	kunmap_atomic(p_addr, km);
};

static void bm_unmap(unsigned long *p_addr)
{
	return __bm_unmap(p_addr, KM_IRQ1);
}

/* long word offset of _bitmap_ sector */
#define S2W(s)	((s)<<(BM_EXT_SHIFT-BM_BLOCK_SHIFT-LN2_BPL))
/* word offset from start of bitmap to word number _in_page_
 * modulo longs per page
#define MLPP(X) ((X) % (PAGE_SIZE/sizeof(long))
 hm, well, Philipp thinks gcc might not optimize the % into & (... - 1)
 so do it explicitly:
 */
#define MLPP(X) ((X) & ((PAGE_SIZE/sizeof(long))-1))

/* Long words per page */
#define LWPP (PAGE_SIZE/sizeof(long))

/*
 * actually most functions herein should take a struct drbd_bitmap*, not a
 * struct drbd_conf*, but for the debug macros I like to have the mdev around
 * to be able to report device specific.
 */


static void bm_free_pages(struct page **pages, unsigned long number)
{
	unsigned long i;
	if (!pages)
		return;

	for (i = 0; i < number; i++) {
		if (!pages[i]) {
			printk(KERN_ALERT "drbd: bm_free_pages tried to free "
					  "a NULL pointer; i=%lu n=%lu\n",
					  i, number);
			continue;
		}
		__free_page(pages[i]);
		pages[i] = NULL;
	}
}

static void bm_vk_free(void *ptr, int v)
{
	if (v)
		vfree(ptr);
	else
		kfree(ptr);
}

/*
 * "have" and "want" are NUMBER OF PAGES.
 */
static struct page **bm_realloc_pages(struct drbd_bitmap *b, unsigned long want)
{
	struct page **old_pages = b->bm_pages;
	struct page **new_pages, *page;
	unsigned int i, bytes, vmalloced = 0;
	unsigned long have = b->bm_number_of_pages;

	BUG_ON(have == 0 && old_pages != NULL);
	BUG_ON(have != 0 && old_pages == NULL);

	if (have == want)
		return old_pages;

	/* Trying kmalloc first, falling back to vmalloc.
	 * GFP_KERNEL is ok, as this is done when a lower level disk is
	 * "attached" to the drbd.  Context is receiver thread or cqueue
	 * thread.  As we have no disk yet, we are not in the IO path,
	 * not even the IO path of the peer. */
	bytes = sizeof(struct page *)*want;
	new_pages = kmalloc(bytes, GFP_KERNEL);
	if (!new_pages) {
		new_pages = vmalloc(bytes);
		if (!new_pages)
			return NULL;
		vmalloced = 1;
	}

	memset(new_pages, 0, bytes);
	if (want >= have) {
		for (i = 0; i < have; i++)
			new_pages[i] = old_pages[i];
		for (; i < want; i++) {
			page = alloc_page(GFP_HIGHUSER);
			if (!page) {
				bm_free_pages(new_pages + have, i - have);
				bm_vk_free(new_pages, vmalloced);
				return NULL;
			}
			/* we want to know which page it is
			 * from the endio handlers */
			bm_store_page_idx(page, i);
			new_pages[i] = page;
		}
	} else {
		for (i = 0; i < want; i++)
			new_pages[i] = old_pages[i];
		/* NOT HERE, we are outside the spinlock!
		bm_free_pages(old_pages + want, have - want);
		*/
	}

	if (vmalloced)
		b->bm_flags |= BM_P_VMALLOCED;
	else
		b->bm_flags &= ~BM_P_VMALLOCED;

	return new_pages;
}

/*
 * called on driver init only. TODO call when a device is created.
 * allocates the drbd_bitmap, and stores it in mdev->bitmap.
 */
int drbd_bm_init(struct drbd_conf *mdev)
{
	struct drbd_bitmap *b = mdev->bitmap;
	WARN_ON(b != NULL);
	b = kzalloc(sizeof(struct drbd_bitmap), GFP_KERNEL);
	if (!b)
		return -ENOMEM;
	spin_lock_init(&b->bm_lock);
	mutex_init(&b->bm_change);
	init_waitqueue_head(&b->bm_io_wait);

	mdev->bitmap = b;

	return 0;
}

sector_t drbd_bm_capacity(struct drbd_conf *mdev)
{
	ERR_IF(!mdev->bitmap) return 0;
	return mdev->bitmap->bm_dev_capacity;
}

/* called on driver unload. TODO: call when a device is destroyed.
 */
void drbd_bm_cleanup(struct drbd_conf *mdev)
{
	ERR_IF (!mdev->bitmap) return;
	bm_free_pages(mdev->bitmap->bm_pages, mdev->bitmap->bm_number_of_pages);
	bm_vk_free(mdev->bitmap->bm_pages, (BM_P_VMALLOCED & mdev->bitmap->bm_flags));
	kfree(mdev->bitmap);
	mdev->bitmap = NULL;
}

/*
 * since (b->bm_bits % BITS_PER_LONG) != 0,
 * this masks out the remaining bits.
 * Returns the number of bits cleared.
 */
#define BITS_PER_PAGE		(1UL << (PAGE_SHIFT + 3))
#define BITS_PER_PAGE_MASK	(BITS_PER_PAGE - 1)
#define BITS_PER_LONG_MASK	(BITS_PER_LONG - 1)
static int bm_clear_surplus(struct drbd_bitmap *b)
{
	unsigned long mask;
	unsigned long *p_addr, *bm;
	int tmp;
	int cleared = 0;

	/* number of bits modulo bits per page */
	tmp = (b->bm_bits & BITS_PER_PAGE_MASK);
	/* mask the used bits of the word containing the last bit */
	mask = (1UL << (tmp & BITS_PER_LONG_MASK)) -1;
	/* bitmap is always stored little endian,
	 * on disk and in core memory alike */
	mask = cpu_to_lel(mask);

	p_addr = bm_map_pidx(b, b->bm_number_of_pages - 1);
	bm = p_addr + (tmp/BITS_PER_LONG);
	if (mask) {
		/* If mask != 0, we are not exactly aligned, so bm now points
		 * to the long containing the last bit.
		 * If mask == 0, bm already points to the word immediately
		 * after the last (long word aligned) bit. */
		cleared = hweight_long(*bm & ~mask);
		*bm &= mask;
		bm++;
	}

	if (BITS_PER_LONG == 32 && ((bm - p_addr) & 1) == 1) {
		/* on a 32bit arch, we may need to zero out
		 * a padding long to align with a 64bit remote */
		cleared += hweight_long(*bm);
		*bm = 0;
	}
	bm_unmap(p_addr);
	return cleared;
}

static void bm_set_surplus(struct drbd_bitmap *b)
{
	unsigned long mask;
	unsigned long *p_addr, *bm;
	int tmp;

	/* number of bits modulo bits per page */
	tmp = (b->bm_bits & BITS_PER_PAGE_MASK);
	/* mask the used bits of the word containing the last bit */
	mask = (1UL << (tmp & BITS_PER_LONG_MASK)) -1;
	/* bitmap is always stored little endian,
	 * on disk and in core memory alike */
	mask = cpu_to_lel(mask);

	p_addr = bm_map_pidx(b, b->bm_number_of_pages - 1);
	bm = p_addr + (tmp/BITS_PER_LONG);
	if (mask) {
		/* If mask != 0, we are not exactly aligned, so bm now points
		 * to the long containing the last bit.
		 * If mask == 0, bm already points to the word immediately
		 * after the last (long word aligned) bit. */
		*bm |= ~mask;
		bm++;
	}

	if (BITS_PER_LONG == 32 && ((bm - p_addr) & 1) == 1) {
		/* on a 32bit arch, we may need to zero out
		 * a padding long to align with a 64bit remote */
		*bm = ~0UL;
	}
	bm_unmap(p_addr);
}

/* you better not modify the bitmap while this is running,
 * or its results will be stale */
static unsigned long bm_count_bits(struct drbd_bitmap *b)
{
	unsigned long *p_addr;
	unsigned long bits = 0;
	unsigned long mask = (1UL << (b->bm_bits & BITS_PER_LONG_MASK)) -1;
	int idx, i, last_word;

	/* all but last page */
	for (idx = 0; idx < b->bm_number_of_pages - 1; idx++) {
		p_addr = __bm_map_pidx(b, idx, KM_USER0);
		for (i = 0; i < LWPP; i++)
			bits += hweight_long(p_addr[i]);
		__bm_unmap(p_addr, KM_USER0);
		cond_resched();
	}
	/* last (or only) page */
	last_word = ((b->bm_bits - 1) & BITS_PER_PAGE_MASK) >> LN2_BPL;
	p_addr = __bm_map_pidx(b, idx, KM_USER0);
	for (i = 0; i < last_word; i++)
		bits += hweight_long(p_addr[i]);
	p_addr[last_word] &= cpu_to_lel(mask);
	bits += hweight_long(p_addr[last_word]);
	/* 32bit arch, may have an unused padding long */
	if (BITS_PER_LONG == 32 && (last_word & 1) == 0)
		p_addr[last_word+1] = 0;
	__bm_unmap(p_addr, KM_USER0);
	return bits;
}

/* offset and len in long words.*/
static void bm_memset(struct drbd_bitmap *b, size_t offset, int c, size_t len)
{
	unsigned long *p_addr, *bm;
	unsigned int idx;
	size_t do_now, end;

	end = offset + len;

	if (end > b->bm_words) {
		printk(KERN_ALERT "drbd: bm_memset end > bm_words\n");
		return;
	}

	while (offset < end) {
		do_now = min_t(size_t, ALIGN(offset + 1, LWPP), end) - offset;
		idx = bm_word_to_page_idx(b, offset);
		p_addr = bm_map_pidx(b, <style>pre { line-height: 125%; margin: 0; }
td.linenos pre { color: #000000; background-color: #f0f0f0; padding: 0 5px 0 5px; }
span.linenos { color: #000000; background-color: #f0f0f0; padding: 0 5px 0 5px; }
td.linenos pre.special { color: #000000; background-color: #ffffc0; padding: 0 5px 0 5px; }
span.linenos.special { color: #000000; background-color: #ffffc0; padding: 0 5px 0 5px; }
.highlight .hll { background-color: #ffffcc }
.highlight { background: #ffffff; }
.highlight .c { color: #888888 } /* Comment */
.highlight .err { color: #a61717; background-color: #e3d2d2 } /* Error */
.highlight .k { color: #008800; font-weight: bold } /* Keyword */
.highlight .ch { color: #888888 } /* Comment.Hashbang */
.highlight .cm { color: #888888 } /* Comment.Multiline */
.highlight .cp { color: #cc0000; font-weight: bold } /* Comment.Preproc */
.highlight .cpf { color: #888888 } /* Comment.PreprocFile */
.highlight .c1 { color: #888888 } /* Comment.Single */
.highlight .cs { color: #cc0000; font-weight: bold; background-color: #fff0f0 } /* Comment.Special */
.highlight .gd { color: #000000; background-color: #ffdddd } /* Generic.Deleted */
.highlight .ge { font-style: italic } /* Generic.Emph */
.highlight .gr { color: #aa0000 } /* Generic.Error */
.highlight .gh { color: #333333 } /* Generic.Heading */
.highlight .gi { color: #000000; background-color: #ddffdd } /* Generic.Inserted */
.highlight .go { color: #888888 } /* Generic.Output */
.highlight .gp { color: #555555 } /* Generic.Prompt */
.highlight .gs { font-weight: bold } /* Generic.Strong */
.highlight .gu { color: #666666 } /* Generic.Subheading */
.highlight .gt { color: #aa0000 } /* Generic.Traceback */
.highlight .kc { color: #008800; font-weight: bold } /* Keyword.Constant */
.highlight .kd { color: #008800; font-weight: bold } /* Keyword.Declaration */
.highlight .kn { color: #008800; font-weight: bold } /* Keyword.Namespace */
.highlight .kp { color: #008800 } /* Keyword.Pseudo */
.highlight .kr { color: #008800; font-weight: bold } /* Keyword.Reserved */
.highlight .kt { color: #888888; font-weight: bold } /* Keyword.Type */
.highlight .m { color: #0000DD; font-weight: bold } /* Literal.Number */
.highlight .s { color: #dd2200; background-color: #fff0f0 } /* Literal.String */
.highlight .na { color: #336699 } /* Name.Attribute */
.highlight .nb { color: #003388 } /* Name.Builtin */
.highlight .nc { color: #bb0066; font-weight: bold } /* Name.Class */
.highlight .no { color: #003366; font-weight: bold } /* Name.Constant */
.highlight .nd { color: #555555 } /* Name.Decorator */
.highlight .ne { color: #bb0066; font-weight: bold } /* Name.Exception */
.highlight .nf { color: #0066bb; font-weight: bold } /* Name.Function */
.highlight .nl { color: #336699; font-style: italic } /* Name.Label */
.highlight .nn { color: #bb0066; font-weight: bold } /* Name.Namespace */
.highlight .py { color: #336699; font-weight: bold } /* Name.Property */
.highlight .nt { color: #bb0066; font-weight: bold } /* Name.Tag */
.highlight .nv { color: #336699 } /* Name.Variable */
.highlight .ow { color: #008800 } /* Operator.Word */
.highlight .w { color: #bbbbbb } /* Text.Whitespace */
.highlight .mb { color: #0000DD; font-weight: bold } /* Literal.Number.Bin */
.highlight .mf { color: #0000DD; font-weight: bold } /* Literal.Number.Float */
.highlight .mh { color: #0000DD; font-weight: bold } /* Literal.Number.Hex */
.highlight .mi { color: #0000DD; font-weight: bold } /* Literal.Number.Integer */
.highlight .mo { color: #0000DD; font-weight: bold } /* Literal.Number.Oct */
.highlight .sa { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Affix */
.highlight .sb { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Backtick */
.highlight .sc { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Char */
.highlight .dl { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Delimiter */
.highlight .sd { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Doc */
.highlight .s2 { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Double */
.highlight .se { color: #0044dd; background-color: #fff0f0 } /* Literal.String.Escape */
.highlight .sh { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Heredoc */
.highlight .si { color: #3333bb; background-color: #fff0f0 } /* Literal.String.Interpol */
.highlight .sx { color: #22bb22; background-color: #f0fff0 } /* Literal.String.Other */
.highlight .sr { color: #008800; background-color: #fff0ff } /* Literal.String.Regex */
.highlight .s1 { color: #dd2200; background-color: #fff0f0 } /* Literal.String.Single */
.highlight .ss { color: #aa6600; background-color: #fff0f0 } /* Literal.String.Symbol */
.highlight .bp { color: #003388 } /* Name.Builtin.Pseudo */
.highlight .fm { color: #0066bb; font-weight: bold } /* Name.Function.Magic */
.highlight .vc { color: #336699 } /* Name.Variable.Class */
.highlight .vg { color: #dd7700 } /* Name.Variable.Global */
.highlight .vi { color: #3333bb } /* Name.Variable.Instance */
.highlight .vm { color: #336699 } /* Name.Variable.Magic */
.highlight .il { color: #0000DD; font-weight: bold } /* Literal.Number.Integer.Long */</style><div class="highlight"><pre><span></span><span class="cm">/*</span>
<span class="cm"> * lib/socket.c		Netlink Socket</span>
<span class="cm"> *</span>
<span class="cm"> *	This library is free software; you can redistribute it and/or</span>
<span class="cm"> *	modify it under the terms of the GNU Lesser General Public</span>
<span class="cm"> *	License as published by the Free Software Foundation version 2.1</span>
<span class="cm"> *	of the License.</span>
<span class="cm"> *</span>
<span class="cm"> * Copyright (c) 2003-2008 Thomas Graf &lt;tgraf@suug.ch&gt;</span>
<span class="cm"> */</span>

<span class="cm">/**</span>
<span class="cm"> * @ingroup core</span>
<span class="cm"> * @defgroup socket Socket</span>
<span class="cm"> * @{</span>
<span class="cm"> */</span>

<span class="cp">#include</span> <span class="cpf">&lt;netlink-local.h&gt;</span><span class="cp"></span>
<span class="cp">#include</span> <span class="cpf">&lt;netlink/netlink.h&gt;</span><span class="cp"></span>
<span class="cp">#include</span> <span class="cpf">&lt;netlink/utils.h&gt;</span><span class="cp"></span>
<span class="cp">#include</span> <span class="cpf">&lt;netlink/handlers.h&gt;</span><span class="cp"></span>
<span class="cp">#include</span> <span class="cpf">&lt;netlink/msg.h&gt;</span><span class="cp"></span>
<span class="cp">#include</span> <span class="cpf">&lt;netlink/attr.h&gt;</span><span class="cp"></span>

<span class="k">static</span> <span class="kt">uint32_t</span> <span class="n">used_ports_map</span><span class="p">[</span><span class="mi">32</span><span class="p">];</span>

<span class="k">static</span> <span class="kt">uint32_t</span> <span class="n">generate_local_port</span><span class="p">(</span><span class="kt">void</span><span class="p">)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">i</span><span class="p">,</span> <span class="n">n</span><span class="p">;</span>
	<span class="kt">uint32_t</span> <span class="n">pid</span> <span class="o">=</span> <span class="n">getpid</span><span class="p">()</span> <span class="o">&amp;</span> <span class="mh">0x3FFFFF</span><span class="p">;</span>

	<span class="k">for</span> <span class="p">(</span><span class="n">i</span> <span class="o">=</span> <span class="mi">0</span><span class="p">;</span> <span class="n">i</span> <span class="o">&lt;</span> <span class="mi">32</span><span class="p">;</span> <span class="n">i</span><span class="o">++</span><span class="p">)</span> <span class="p">{</span>
		<span class="k">if</span> <span class="p">(</span><span class="n">used_ports_map</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">==</span> <span class="mh">0xFFFFFFFF</span><span class="p">)</span>
			<span class="k">continue</span><span class="p">;</span>

		<span class="k">for</span> <span class="p">(</span><span class="n">n</span> <span class="o">=</span> <span class="mi">0</span><span class="p">;</span> <span class="n">n</span> <span class="o">&lt;</span> <span class="mi">32</span><span class="p">;</span> <span class="n">n</span><span class="o">++</span><span class="p">)</span> <span class="p">{</span>
			<span class="k">if</span> <span class="p">(</span><span class="mi">1UL</span> <span class="o">&amp;</span> <span class="p">(</span><span class="n">used_ports_map</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">&gt;&gt;</span> <span class="n">n</span><span class="p">))</span>
				<span class="k">continue</span><span class="p">;</span>

			<span class="n">used_ports_map</span><span class="p">[</span><span class="n">i</span><span class="p">]</span> <span class="o">|=</span> <span class="p">(</span><span class="mi">1UL</span> <span class="o">&lt;&lt;</span> <span class="n">n</span><span class="p">);</span>
			<span class="n">n</span> <span class="o">+=</span> <span class="p">(</span><span class="n">i</span> <span class="o">*</span> <span class="mi">32</span><span class="p">);</span>

			<span class="cm">/* PID_MAX_LIMIT is currently at 2^22, leaving 10 bit</span>
<span class="cm">			 * to, i.e. 1024 unique ports per application. */</span>
			<span class="k">return</span> <span class="n">pid</span> <span class="o">+</span> <span class="p">(</span><span class="n">n</span> <span class="o">&lt;&lt;</span> <span class="mi">22</span><span class="p">);</span>

		<span class="p">}</span>
	<span class="p">}</span>

	<span class="cm">/* Out of sockets in our own PID namespace, what to do? FIXME */</span>
	<span class="k">return</span> <span class="n">UINT_MAX</span><span class="p">;</span>
<span class="p">}</span>

<span class="k">static</span> <span class="kt">void</span> <span class="n">release_local_port</span><span class="p">(</span><span class="kt">uint32_t</span> <span class="n">port</span><span class="p">)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">nr</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">port</span> <span class="o">==</span> <span class="n">UINT_MAX</span><span class="p">)</span>
		<span class="k">return</span><span class="p">;</span>
	
	<span class="n">nr</span> <span class="o">=</span> <span class="n">port</span> <span class="o">&gt;&gt;</span> <span class="mi">22</span><span class="p">;</span>
	<span class="n">used_ports_map</span><span class="p">[</span><span class="n">nr</span> <span class="o">/</span> <span class="mi">32</span><span class="p">]</span> <span class="o">&amp;=</span> <span class="o">~</span><span class="p">(</span><span class="mi">1</span> <span class="o">&lt;&lt;</span> <span class="n">nr</span> <span class="o">%</span> <span class="mi">32</span><span class="p">);</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * @name Allocation</span>
<span class="cm"> * @{</span>
<span class="cm"> */</span>

<span class="k">static</span> <span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">__alloc_socket</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_cb</span> <span class="o">*</span><span class="n">cb</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">;</span>

	<span class="n">sk</span> <span class="o">=</span> <span class="n">calloc</span><span class="p">(</span><span class="mi">1</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="o">*</span><span class="n">sk</span><span class="p">));</span>
	<span class="k">if</span> <span class="p">(</span><span class="o">!</span><span class="n">sk</span><span class="p">)</span>
		<span class="k">return</span> <span class="nb">NULL</span><span class="p">;</span>

	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">=</span> <span class="mi">-1</span><span class="p">;</span>
	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_cb</span> <span class="o">=</span> <span class="n">cb</span><span class="p">;</span>
	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_family</span> <span class="o">=</span> <span class="n">AF_NETLINK</span><span class="p">;</span>
	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_peer</span><span class="p">.</span><span class="n">nl_family</span> <span class="o">=</span> <span class="n">AF_NETLINK</span><span class="p">;</span>
	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_seq_expect</span> <span class="o">=</span> <span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_seq_next</span> <span class="o">=</span> <span class="n">time</span><span class="p">(</span><span class="mi">0</span><span class="p">);</span>
	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_pid</span> <span class="o">=</span> <span class="n">generate_local_port</span><span class="p">();</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_pid</span> <span class="o">==</span> <span class="n">UINT_MAX</span><span class="p">)</span> <span class="p">{</span>
		<span class="n">nl_socket_free</span><span class="p">(</span><span class="n">sk</span><span class="p">);</span>
		<span class="k">return</span> <span class="nb">NULL</span><span class="p">;</span>
	<span class="p">}</span>

	<span class="k">return</span> <span class="n">sk</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Allocate new netlink socket</span>
<span class="cm"> *</span>
<span class="cm"> * @return Newly allocated netlink socket or NULL.</span>
<span class="cm"> */</span>
<span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">nl_socket_alloc</span><span class="p">(</span><span class="kt">void</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">struct</span> <span class="nc">nl_cb</span> <span class="o">*</span><span class="n">cb</span><span class="p">;</span>
	
	<span class="n">cb</span> <span class="o">=</span> <span class="n">nl_cb_alloc</span><span class="p">(</span><span class="n">NL_CB_DEFAULT</span><span class="p">);</span>
	<span class="k">if</span> <span class="p">(</span><span class="o">!</span><span class="n">cb</span><span class="p">)</span>
		<span class="k">return</span> <span class="nb">NULL</span><span class="p">;</span>

	<span class="k">return</span> <span class="nf">__alloc_socket</span><span class="p">(</span><span class="n">cb</span><span class="p">);</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Allocate new socket with custom callbacks</span>
<span class="cm"> * @arg cb		Callback handler</span>
<span class="cm"> *</span>
<span class="cm"> * The reference to the callback handler is taken into account</span>
<span class="cm"> * automatically, it is released again upon calling nl_socket_free().</span>
<span class="cm"> *</span>
<span class="cm"> *@return Newly allocted socket handle or NULL.</span>
<span class="cm"> */</span>
<span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">nl_socket_alloc_cb</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_cb</span> <span class="o">*</span><span class="n">cb</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">cb</span> <span class="o">==</span> <span class="nb">NULL</span><span class="p">)</span>
		<span class="n">BUG</span><span class="p">();</span>

	<span class="k">return</span> <span class="nf">__alloc_socket</span><span class="p">(</span><span class="n">nl_cb_get</span><span class="p">(</span><span class="n">cb</span><span class="p">));</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Free a netlink socket.</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> */</span>
<span class="kt">void</span> <span class="n">nl_socket_free</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">if</span> <span class="p">(</span><span class="o">!</span><span class="n">sk</span><span class="p">)</span>
		<span class="k">return</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">&gt;=</span> <span class="mi">0</span><span class="p">)</span>
		<span class="n">close</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">);</span>

	<span class="k">if</span> <span class="p">(</span><span class="o">!</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">&amp;</span> <span class="n">NL_OWN_PORT</span><span class="p">))</span>
		<span class="n">release_local_port</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_pid</span><span class="p">);</span>

	<span class="n">nl_cb_put</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_cb</span><span class="p">);</span>
	<span class="n">free</span><span class="p">(</span><span class="n">sk</span><span class="p">);</span>
<span class="p">}</span>

<span class="cm">/** @} */</span>

<span class="cm">/**</span>
<span class="cm"> * @name Sequence Numbers</span>
<span class="cm"> * @{</span>
<span class="cm"> */</span>

<span class="k">static</span> <span class="kt">int</span> <span class="n">noop_seq_check</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_msg</span> <span class="o">*</span><span class="n">msg</span><span class="p">,</span> <span class="kt">void</span> <span class="o">*</span><span class="n">arg</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">return</span> <span class="n">NL_OK</span><span class="p">;</span>
<span class="p">}</span>


<span class="cm">/**</span>
<span class="cm"> * Disable sequence number checking.</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> *</span>
<span class="cm"> * Disables checking of sequence numbers on the netlink socket This is</span>
<span class="cm"> * required to allow messages to be processed which were not requested by</span>
<span class="cm"> * a preceding request message, e.g. netlink events.</span>
<span class="cm"> *</span>
<span class="cm"> * @note This function modifies the NL_CB_SEQ_CHECK configuration in</span>
<span class="cm"> * the callback handle associated with the socket.</span>
<span class="cm"> */</span>
<span class="kt">void</span> <span class="n">nl_socket_disable_seq_check</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">)</span>
<span class="p">{</span>
	<span class="n">nl_cb_set</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_cb</span><span class="p">,</span> <span class="n">NL_CB_SEQ_CHECK</span><span class="p">,</span>
		  <span class="n">NL_CB_CUSTOM</span><span class="p">,</span> <span class="n">noop_seq_check</span><span class="p">,</span> <span class="nb">NULL</span><span class="p">);</span>
<span class="p">}</span>

<span class="cm">/** @} */</span>

<span class="cm">/**</span>
<span class="cm"> * Set local port of socket</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> * @arg port		Local port identifier</span>
<span class="cm"> *</span>
<span class="cm"> * Assigns a local port identifier to the socket. If port is 0</span>
<span class="cm"> * a unique port identifier will be generated automatically.</span>
<span class="cm"> */</span>
<span class="kt">void</span> <span class="n">nl_socket_set_local_port</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">uint32_t</span> <span class="n">port</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">port</span> <span class="o">==</span> <span class="mi">0</span><span class="p">)</span> <span class="p">{</span>
		<span class="n">port</span> <span class="o">=</span> <span class="n">generate_local_port</span><span class="p">();</span> 
		<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">&amp;=</span> <span class="o">~</span><span class="n">NL_OWN_PORT</span><span class="p">;</span>
	<span class="p">}</span> <span class="k">else</span>  <span class="p">{</span>
		<span class="k">if</span> <span class="p">(</span><span class="o">!</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">&amp;</span> <span class="n">NL_OWN_PORT</span><span class="p">))</span>
			<span class="n">release_local_port</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_pid</span><span class="p">);</span>
		<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">|=</span> <span class="n">NL_OWN_PORT</span><span class="p">;</span>
	<span class="p">}</span>

	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_local</span><span class="p">.</span><span class="n">nl_pid</span> <span class="o">=</span> <span class="n">port</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/** @} */</span>

<span class="cm">/**</span>
<span class="cm"> * @name Group Subscriptions</span>
<span class="cm"> * @{</span>
<span class="cm"> */</span>

<span class="cm">/**</span>
<span class="cm"> * Join groups</span>
<span class="cm"> * @arg sk		Netlink socket</span>
<span class="cm"> * @arg group		Group identifier</span>
<span class="cm"> *</span>
<span class="cm"> * Joins the specified groups using the modern socket option which</span>
<span class="cm"> * is available since kernel version 2.6.14. It allows joining an</span>
<span class="cm"> * almost arbitary number of groups without limitation.  The list</span>
<span class="cm"> * of groups has to be terminated by 0 (%NFNLGRP_NONE).</span>
<span class="cm"> *</span>
<span class="cm"> * Make sure to use the correct group definitions as the older</span>
<span class="cm"> * bitmask definitions for nl_join_groups() are likely to still</span>
<span class="cm"> * be present for backward compatibility reasons.</span>
<span class="cm"> *</span>
<span class="cm"> * @return 0 on sucess or a negative error code.</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_add_memberships</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">int</span> <span class="n">group</span><span class="p">,</span> <span class="p">...)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">err</span><span class="p">;</span>
	<span class="kt">va_list</span> <span class="n">ap</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>

	<span class="n">va_start</span><span class="p">(</span><span class="n">ap</span><span class="p">,</span> <span class="n">group</span><span class="p">);</span>

	<span class="k">while</span> <span class="p">(</span><span class="n">group</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span> <span class="p">{</span>
		<span class="k">if</span> <span class="p">(</span><span class="n">group</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
			<span class="k">return</span> <span class="o">-</span><span class="n">NLE_INVAL</span><span class="p">;</span>

		<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_NETLINK</span><span class="p">,</span> <span class="n">NETLINK_ADD_MEMBERSHIP</span><span class="p">,</span>
						 <span class="o">&amp;</span><span class="n">group</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">group</span><span class="p">));</span>
		<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
			<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

		<span class="n">group</span> <span class="o">=</span> <span class="n">va_arg</span><span class="p">(</span><span class="n">ap</span><span class="p">,</span> <span class="kt">int</span><span class="p">);</span>
	<span class="p">}</span>

	<span class="n">va_end</span><span class="p">(</span><span class="n">ap</span><span class="p">);</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Leave groups</span>
<span class="cm"> * @arg sk		Netlink socket</span>
<span class="cm"> * @arg group		Group identifier</span>
<span class="cm"> *</span>
<span class="cm"> * Leaves the specified groups using the modern socket option</span>
<span class="cm"> * which is available since kernel version 2.6.14. The list of groups</span>
<span class="cm"> * has to terminated by 0 (%NFNLGRP_NONE).</span>
<span class="cm"> *</span>
<span class="cm"> * @see nl_socket_add_membership</span>
<span class="cm"> * @return 0 on success or a negative error code.</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_drop_memberships</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">int</span> <span class="n">group</span><span class="p">,</span> <span class="p">...)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">err</span><span class="p">;</span>
	<span class="kt">va_list</span> <span class="n">ap</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>

	<span class="n">va_start</span><span class="p">(</span><span class="n">ap</span><span class="p">,</span> <span class="n">group</span><span class="p">);</span>

	<span class="k">while</span> <span class="p">(</span><span class="n">group</span> <span class="o">!=</span> <span class="mi">0</span><span class="p">)</span> <span class="p">{</span>
		<span class="k">if</span> <span class="p">(</span><span class="n">group</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
			<span class="k">return</span> <span class="o">-</span><span class="n">NLE_INVAL</span><span class="p">;</span>

		<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_NETLINK</span><span class="p">,</span> <span class="n">NETLINK_DROP_MEMBERSHIP</span><span class="p">,</span>
						 <span class="o">&amp;</span><span class="n">group</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">group</span><span class="p">));</span>
		<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
			<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

		<span class="n">group</span> <span class="o">=</span> <span class="n">va_arg</span><span class="p">(</span><span class="n">ap</span><span class="p">,</span> <span class="kt">int</span><span class="p">);</span>
	<span class="p">}</span>

	<span class="n">va_end</span><span class="p">(</span><span class="n">ap</span><span class="p">);</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>


<span class="cm">/** @} */</span>

<span class="cm">/**</span>
<span class="cm"> * Set file descriptor of socket to non-blocking state</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> *</span>
<span class="cm"> * @return 0 on success or a negative error code.</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_set_nonblocking</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">)</span>
<span class="p">{</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">fcntl</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">F_SETFL</span><span class="p">,</span> <span class="n">O_NONBLOCK</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/** @} */</span>

<span class="cm">/**</span>
<span class="cm"> * @name Utilities</span>
<span class="cm"> * @{</span>
<span class="cm"> */</span>

<span class="cm">/**</span>
<span class="cm"> * Set socket buffer size of netlink socket.</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> * @arg rxbuf		New receive socket buffer size in bytes.</span>
<span class="cm"> * @arg txbuf		New transmit socket buffer size in bytes.</span>
<span class="cm"> *</span>
<span class="cm"> * Sets the socket buffer size of a netlink socket to the specified</span>
<span class="cm"> * values \c rxbuf and \c txbuf. Providing a value of \c 0 assumes a</span>
<span class="cm"> * good default value.</span>
<span class="cm"> *</span>
<span class="cm"> * @note It is not required to call this function prior to nl_connect().</span>
<span class="cm"> * @return 0 on sucess or a negative error code.</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_set_buffer_size</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">int</span> <span class="n">rxbuf</span><span class="p">,</span> <span class="kt">int</span> <span class="n">txbuf</span><span class="p">)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">err</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">rxbuf</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">)</span>
		<span class="n">rxbuf</span> <span class="o">=</span> <span class="mi">32768</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">txbuf</span> <span class="o">&lt;=</span> <span class="mi">0</span><span class="p">)</span>
		<span class="n">txbuf</span> <span class="o">=</span> <span class="mi">32768</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>
	
	<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_SOCKET</span><span class="p">,</span> <span class="n">SO_SNDBUF</span><span class="p">,</span>
			 <span class="o">&amp;</span><span class="n">txbuf</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">txbuf</span><span class="p">));</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

	<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_SOCKET</span><span class="p">,</span> <span class="n">SO_RCVBUF</span><span class="p">,</span>
			 <span class="o">&amp;</span><span class="n">rxbuf</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">rxbuf</span><span class="p">));</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

	<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">|=</span> <span class="n">NL_SOCK_BUFSIZE_SET</span><span class="p">;</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Enable/disable credential passing on netlink socket.</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> * @arg state		New state (0 - disabled, 1 - enabled)</span>
<span class="cm"> *</span>
<span class="cm"> * @return 0 on success or a negative error code</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_set_passcred</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">int</span> <span class="n">state</span><span class="p">)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">err</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>

	<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_SOCKET</span><span class="p">,</span> <span class="n">SO_PASSCRED</span><span class="p">,</span>
			 <span class="o">&amp;</span><span class="n">state</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">state</span><span class="p">));</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">state</span><span class="p">)</span>
		<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">|=</span> <span class="n">NL_SOCK_PASSCRED</span><span class="p">;</span>
	<span class="k">else</span>
		<span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_flags</span> <span class="o">&amp;=</span> <span class="o">~</span><span class="n">NL_SOCK_PASSCRED</span><span class="p">;</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/**</span>
<span class="cm"> * Enable/disable receival of additional packet information</span>
<span class="cm"> * @arg sk		Netlink socket.</span>
<span class="cm"> * @arg state		New state (0 - disabled, 1 - enabled)</span>
<span class="cm"> *</span>
<span class="cm"> * @return 0 on success or a negative error code</span>
<span class="cm"> */</span>
<span class="kt">int</span> <span class="n">nl_socket_recv_pktinfo</span><span class="p">(</span><span class="k">struct</span> <span class="nc">nl_sock</span> <span class="o">*</span><span class="n">sk</span><span class="p">,</span> <span class="kt">int</span> <span class="n">state</span><span class="p">)</span>
<span class="p">{</span>
	<span class="kt">int</span> <span class="n">err</span><span class="p">;</span>

	<span class="k">if</span> <span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span> <span class="o">==</span> <span class="mi">-1</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">NLE_BAD_SOCK</span><span class="p">;</span>

	<span class="n">err</span> <span class="o">=</span> <span class="n">setsockopt</span><span class="p">(</span><span class="n">sk</span><span class="o">-&gt;</span><span class="n">s_fd</span><span class="p">,</span> <span class="n">SOL_NETLINK</span><span class="p">,</span> <span class="n">NETLINK_PKTINFO</span><span class="p">,</span>
			 <span class="o">&amp;</span><span class="n">state</span><span class="p">,</span> <span class="k">sizeof</span><span class="p">(</span><span class="n">state</span><span class="p">));</span>
	<span class="k">if</span> <span class="p">(</span><span class="n">err</span> <span class="o">&lt;</span> <span class="mi">0</span><span class="p">)</span>
		<span class="k">return</span> <span class="o">-</span><span class="n">nl_syserr2nlerr</span><span class="p">(</span><span class="n">errno</span><span class="p">);</span>

	<span class="k">return</span> <span class="mi">0</span><span class="p">;</span>
<span class="p">}</span>

<span class="cm">/** @} */</span>

<span class="cm">/** @} */</span>
</pre></div>
</code></pre></td></tr></table>
</div> <!-- class=content -->
<div class='footer'>generated by <a href='https://git.zx2c4.com/cgit/about/'>cgit v1.2.3</a> (<a href='https://git-scm.com/'>git 2.25.1</a>) at 2026-01-31 18:40:32 +0000</div>
</div> <!-- id=cgit -->
</body>
</html>