github4ry
diff --git a/‎examples/tutorial_pandas.py
Lines changed: 4 additions & 1 deletion b/‎examples/tutorial_pandas.py
Lines changed: 4 additions & 1 deletion
diff --git a/‎influxdb/_dataframe_client.py
Lines changed: 98 additions & 71 deletions b/‎influxdb/_dataframe_client.py
Lines changed: 98 additions & 71 deletions
@@ -20,7 +20,10 @@ def main(host='localhost', port=8086):
     client.create_database(dbname)
 
     print("Write DataFrame")
-    client.write_points({'demo': df})
+    client.write_points(df, 'demo')
+
+    print("Write DataFrame with Tags")
+    client.write_points(df, 'demo', {'k1': 'v1', 'k2': 'v2'})
 
     print("Read DataFrame")
     client.query("select * from demo")
 
@@ -3,11 +3,22 @@
 DataFrame client for InfluxDB
 """
 import math
-import warnings
+
+import pandas as pd
 
 from .client import InfluxDBClient
 
-import pandas as pd
+
+def _pandas_time_unit(time_precision):
+    unit = time_precision
+    if time_precision == 'm':
+        unit = 'ms'
+    elif time_precision == 'u':
+        unit = 'us'
+    elif time_precision == 'n':
+        unit = 'ns'
+    assert unit in ('s', 'ms', 'us', 'ns')
+    return unit
 
 
 class DataFrameClient(InfluxDBClient):
@@ -19,112 +30,128 @@ class DataFrameClient(InfluxDBClient):
 
     EPOCH = pd.Timestamp('1970-01-01 00:00:00.000+00:00')
 
-    def write_points(self, data, *args, **kwargs):
+    def write_points(self, dataframe, measurement, tags=None,
+                     time_precision=None, database=None, retention_policy=None,
+                     batch_size=None):
         """
         Write to multiple time series names.
 
-        :param data: A dictionary mapping series names to pandas DataFrames
-        :param time_precision: [Optional, default 's'] Either 's', 'm', 'ms'
-            or 'u'.
+        :param dataframe: data points in a DataFrame
+        :param measurement: name of measurement
+        :param tags: dictionary of tags, with string key-values
+        :param time_precision: [Optional, default 's'] Either 's', 'ms', 'u'
+            or 'n'.
         :param batch_size: [Optional] Value to write the points in batches
             instead of all at one time. Useful for when doing data dumps from
             one database to another or when doing a massive write operation
         :type batch_size: int
-        """
 
-        batch_size = kwargs.get('batch_size')
-        time_precision = kwargs.get('time_precision', 's')
+        """
         if batch_size:
-            kwargs.pop('batch_size')  # don't hand over to InfluxDBClient
-            for key, data_frame in data.items():
-                number_batches = int(math.ceil(
-                    len(data_frame) / float(batch_size)))
-                for batch in range(number_batches):
-                    start_index = batch * batch_size
-                    end_index = (batch + 1) * batch_size
-                    data = [self._convert_dataframe_to_json(
-                        name=key,
-                        dataframe=data_frame.ix[start_index:end_index].copy(),
-                        time_precision=time_precision)]
-                    super(DataFrameClient, self).write_points(data,
-                                                              *args, **kwargs)
+            number_batches = int(math.ceil(
+                len(dataframe) / float(batch_size)))
+            for batch in range(number_batches):
+                start_index = batch * batch_size
+                end_index = (batch + 1) * batch_size
+                points = self._convert_dataframe_to_json(
+                    dataframe.ix[start_index:end_index].copy(),
+                    measurement,
+                    tags
+                )
+                super(DataFrameClient, self).write_points(
+                    points, time_precision, database, retention_policy)
             return True
         else:
-            data = [self._convert_dataframe_to_json(
-                name=key, dataframe=dataframe, time_precision=time_precision)
-                for key, dataframe in data.items()]
-            return super(DataFrameClient, self).write_points(data,
-                                                             *args, **kwargs)
-
-    def write_points_with_precision(self, data, time_precision='s'):
-        """
-        DEPRECATED. Write to multiple time series names
+            points = self._convert_dataframe_to_json(
+                dataframe, measurement, tags
+            )
+            super(DataFrameClient, self).write_points(
+                points, time_precision, database, retention_policy)
+            return True
 
-        """
-        warnings.warn(
-            "write_points_with_precision is deprecated, and will be removed "
-            "in future versions. Please use "
-            "``DataFrameClient.write_points(time_precision='..')`` instead.",
-            FutureWarning)
-        return self.write_points(data, time_precision='s')
-
-    def query(self, query, time_precision='s', chunked=False, database=None):
+    def query(self, query, chunked=False, database=None):
         """
         Quering data into a DataFrame.
 
-        :param time_precision: [Optional, default 's'] Either 's', 'm', 'ms'
-            or 'u'.
         :param chunked: [Optional, default=False] True if the data shall be
             retrieved in chunks, False otherwise.
 
         """
         results = super(DataFrameClient, self).query(query, database=database)
-        if len(results) > 0:
-            return self._to_dataframe(results, time_precision)
+        if query.upper().startswith("SELECT"):
+            if len(results) > 0:
+                return self._to_dataframe(results)
+            else:
+                return {}
         else:
             return results
 
-    def _to_dataframe(self, json_result, time_precision):
-        dataframe = pd.DataFrame(data=json_result['points'],
-                                 columns=json_result['columns'])
-        if 'sequence_number' in dataframe:
-            dataframe.sort(['time', 'sequence_number'], inplace=True)
+    def get_list_series(self, database=None):
+        """
+        Get the list of series, in DataFrame
+
+        """
+        results = super(DataFrameClient, self)\
+            .query("SHOW SERIES", database=database)
+        if len(results):
+            return dict(
+                (key[0], pd.DataFrame(data)) for key, data in results.items()
+            )
         else:
-            dataframe.sort(['time'], inplace=True)
-        pandas_time_unit = time_precision
-        if time_precision == 'm':
-            pandas_time_unit = 'ms'
-        elif time_precision == 'u':
-            pandas_time_unit = 'us'
-        dataframe.index = pd.to_datetime(list(dataframe['time']),
-                                         unit=pandas_time_unit,
-                                         utc=True)
-        del dataframe['time']
-        return dataframe
-
-    def _convert_dataframe_to_json(self, dataframe, name, time_precision='s'):
+            return {}
+
+    def _to_dataframe(self, rs):
+        result = {}
+        for key, data in rs.items():
+            name, tags = key
+            if tags is None:
+                key = name
+            else:
+                key = (name, tuple(sorted(tags.items())))
+            df = pd.DataFrame(data)
+            df.time = pd.to_datetime(df.time)
+            df.set_index('time', inplace=True)
+            df.index = df.index.tz_localize('UTC')
+            df.index.name = None
+            result[key] = df
+        return result
+
+    def _convert_dataframe_to_json(self, dataframe, measurement, tags=None):
+
         if not isinstance(dataframe, pd.DataFrame):
             raise TypeError('Must be DataFrame, but type was: {}.'
                             .format(type(dataframe)))
         if not (isinstance(dataframe.index, pd.tseries.period.PeriodIndex) or
                 isinstance(dataframe.index, pd.tseries.index.DatetimeIndex)):
             raise TypeError('Must be DataFrame with DatetimeIndex or \
                             PeriodIndex.')
+
         dataframe.index = dataframe.index.to_datetime()
         if dataframe.index.tzinfo is None:
             dataframe.index = dataframe.index.tz_localize('UTC')
-        dataframe['time'] = [self._datetime_to_epoch(dt, time_precision)
-                             for dt in dataframe.index]
-        data = {'name': name,
-                'columns': [str(column) for column in dataframe.columns],
-                'points': list([list(x) for x in dataframe.values])}
-        return data
+
+        # Convert column to strings
+        dataframe.columns = dataframe.columns.astype('str')
+
+        # Convert dtype for json serialization
+        dataframe = dataframe.astype('object')
+
+        points = [
+            {'name': measurement,
+             'tags': tags if tags else {},
+             'fields': rec,
+             'timestamp': ts.isoformat()
+             }
+            for ts, rec in zip(dataframe.index, dataframe.to_dict('record'))]
+        return points
 
     def _datetime_to_epoch(self, datetime, time_precision='s'):
         seconds = (datetime - self.EPOCH).total_seconds()
         if time_precision == 's':
             return seconds
-        elif time_precision == 'm' or time_precision == 'ms':
-            return seconds * 1000
+        elif time_precision == 'ms':
+            return seconds * 10 ** 3
         elif time_precision == 'u':
-            return seconds * 1000000
+            return seconds * 10 ** 6
+        elif time_precision == 'n':
+            return seconds * 10 ** 9