Moved writing DataFrames to write_points

timtroendle · timtroendle · commit 2e9fbf5450e2 · 2014-11-16T22:27:34.000+01:00
diff --git a/influxdb/client.py b/influxdb/client.py
@@ -167,12 +167,14 @@ def request(self, url, method='GET', params=None, data=None,
     # by doing a POST to /db/foo_production/series?u=some_user&p=some_password
     # with a JSON body of points.
 
-    def write_points(self, *args, **kwargs):
+    def write_points(self, data, *args, **kwargs):
         """
         write_points()
 
         Write to multiple time series names.
 
+        :param data: A list of dicts, or a dictionary mapping series names to
+            pandas DataFrames
         :param batch_size: [Optional] Value to write the points in batches
             instead of all at one time. Useful for when doing data dumps from
             one database to another or when doing a massive write operation
@@ -185,27 +187,30 @@ def list_chunks(l, n):
             for i in xrange(0, len(l), n):
                 yield l[i:i + n]
 
+        # check for pandas dataframe
+        if isinstance(data, dict):
+            data = [self._convert_dataframe_to_json(name=key, dataframe=value) for key, value in data.items()]
         batch_size = kwargs.get('batch_size')
         if batch_size:
-            for data in kwargs.get('data'):
-                name = data.get('name')
-                columns = data.get('columns')
-                point_list = data.get('points')
+            for item in data:
+                name = item.get('name')
+                columns = item.get('columns')
+                point_list = item.get('points')
 
                 for batch in list_chunks(point_list, batch_size):
-                    data = [{
+                    item = [{
                         "points": batch,
                         "name": name,
                         "columns": columns
                     }]
                     time_precision = kwargs.get('time_precision', 's')
                     self.write_points_with_precision(
-                        data=data,
+                        data=item,
                         time_precision=time_precision)
 
                 return True
 
-        return self.write_points_with_precision(*args, **kwargs)
+        return self.write_points_with_precision(data, *args, **kwargs)
 
     def write_points_with_precision(self, data, time_precision='s'):
         """
@@ -220,6 +225,10 @@ def write_points_with_precision(self, data, time_precision='s'):
                 "InfluxDB only supports seconds precision for udp writes"
             )
 
+        # check for pandas dataframe
+        if isinstance(data, dict):
+            data = [self._convert_dataframe_to_json(name=key, dataframe=value) for key, value in data.items()]
+
         url = "db/{0}/series".format(self._database)
 
         params = {
@@ -239,6 +248,23 @@ def write_points_with_precision(self, data, time_precision='s'):
 
         return True
 
+    def _convert_dataframe_to_json(self, dataframe, name):
+        try:
+            import pandas as pd
+        except ImportError:
+            raise ImportError('pandas required for writing as dataframe.')
+        if not isinstance(dataframe, pd.DataFrame):
+            raise TypeError('Must be DataFrame, but type was: {}.'.format(type(dataframe)))
+        if not (isinstance(dataframe.index, pd.tseries.period.PeriodIndex) or
+                isinstance(dataframe.index, pd.tseries.index.DatetimeIndex)):
+            raise TypeError('Must be DataFrame with DatetimeIndex or PeriodIndex.')
+        dataframe.index = dataframe.index.to_datetime()
+        dataframe['time'] = [time.mktime(dt.timetuple()) for dt in dataframe.index]
+        data = {'name':name,
+                'columns':list(dataframe.columns),
+                'points':list([list(x) for x in dataframe.values])}
+        return data
+
     # One Time Deletes
 
     def delete_points(self, name):
@@ -299,6 +325,13 @@ def remove_scheduled_delete(self, delete_id):
     def query(self, query, time_precision='s', chunked=False, output_format='json'):
         """
         Quering data
+
+        :param time_precision: [Optional, default 's'] Either 's', 'm', 'ms' or 'u'.
+        :param chunked: [Optional, default=False] True if the data shall be retrieved
+            in chunks, False otherwise.
+        :param output_format: [Optional, default 'json'] Format of the resulting
+            output. Can be 'json' or 'dataframe' for a pandas DataFrame.
+
         """
         if time_precision not in ['s', 'm', 'ms', 'u']:
             raise Exception(
@@ -740,22 +773,3 @@ def send_packet(self, packet):
         data = json.dumps(packet)
         byte = data.encode('utf-8')
         self.udp_socket.sendto(byte, (self._host, self.udp_port))
-
-    def write_points_from_dataframe(self, dataframe, name):
-        try:
-            import pandas as pd
-        except ImportError:
-            raise ImportError('pandas required for writing as dataframe.')
-        if not isinstance(dataframe, pd.DataFrame):
-            raise TypeError('Must be DataFrame, but type was: {}.'.format(type(dataframe)))
-        if not (isinstance(dataframe.index, pd.tseries.period.PeriodIndex) or
-                isinstance(dataframe.index, pd.tseries.index.DatetimeIndex)):
-            raise TypeError('Must be DataFrame with DatetimeIndex or PeriodIndex.')
-        dataframe.index = dataframe.index.to_datetime()
-        dataframe['time'] = [time.mktime(dt.timetuple()) for dt in dataframe.index]
-        data = dict()
-        data['name'] = name
-        data['columns'] = list(dataframe.columns)
-        data['points'] = list([list(x) for x in dataframe.values])
-        print(data)
-        self.write_points(data=[data], time_precision='s')
diff --git a/tests/influxdb/client_test.py b/tests/influxdb/client_test.py
@@ -599,7 +599,7 @@ def test_update_permission(self):
 
     def test_write_points_from_dataframe(self):
         now = datetime(2014, 11, 15, 15, 42, 44, 543)
-        self.dummy_points = [
+        points = [
             {
                 "points": [
                     ["1", 1, 1.0, time.mktime(now.timetuple())],
@@ -609,29 +609,21 @@ def test_write_points_from_dataframe(self):
                 "columns": ["column_one", "column_two", "column_three", "time"]
             }
         ]
-        self.dummy_dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
-                                            index = [now, now + timedelta(hours=1)],
-                                            columns=["column_one", "column_two", "column_three"])
+        dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
+                                 index = [now, now + timedelta(hours=1)],
+                                 columns=["column_one", "column_two", "column_three"])
 
         with requests_mock.Mocker() as m:
-            m.register_uri(
-                requests_mock.POST,
-                "http://localhost:8086/db/db/series"
-            )
+            m.register_uri(requests_mock.POST, "http://localhost:8086/db/db/series")
 
             cli = InfluxDBClient(database='db')
-            cli.write_points_from_dataframe(
-                self.dummy_dataframe, name="foo"
-            )
+            cli.write_points({"foo":dataframe})
 
-            self.assertListEqual(
-                json.loads(m.last_request.body),
-                self.dummy_points
-            )
+            self.assertListEqual(json.loads(m.last_request.body), points)
 
     def test_write_points_from_dataframe_with_period_index(self):
         now = datetime(2014, 11, 16)
-        self.dummy_points = [
+        points = [
             {
                 "points": [
                     ["1", 1, 1.0, time.mktime(now.timetuple())],
@@ -641,47 +633,39 @@ def test_write_points_from_dataframe_with_period_index(self):
                 "columns": ["column_one", "column_two", "column_three", "time"]
             }
         ]
-        self.dummy_dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
-                                            index = [pd.Period('2014-11-16'), pd.Period('2014-11-17')],
-                                            columns=["column_one", "column_two", "column_three"])
+        dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
+                                 index = [pd.Period('2014-11-16'), pd.Period('2014-11-17')],
+                                 columns=["column_one", "column_two", "column_three"])
 
         with requests_mock.Mocker() as m:
-            m.register_uri(
-                requests_mock.POST,
-                "http://localhost:8086/db/db/series"
-            )
+            m.register_uri(requests_mock.POST, "http://localhost:8086/db/db/series")
 
             cli = InfluxDBClient(database='db')
-            cli.write_points_from_dataframe(
-                self.dummy_dataframe, name="foo"
-            )
+            cli.write_points({"foo":dataframe})
 
-            self.assertListEqual(
-                json.loads(m.last_request.body),
-                self.dummy_points
-            )
+            self.assertListEqual(json.loads(m.last_request.body), points)
 
     @raises(TypeError)
     def test_write_points_from_dataframe_fails_without_time_index(self):
-        self.dummy_dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
-                                            columns=["column_one", "column_two", "column_three"])
+        dataframe = pd.DataFrame(data=[["1", 1, 1.0], ["2", 2, 2.0]],
+                                 columns=["column_one", "column_two", "column_three"])
 
         with requests_mock.Mocker() as m:
             m.register_uri(requests_mock.POST, "http://localhost:8086/db/db/series")
 
             cli = InfluxDBClient(database='db')
-            cli.write_points_from_dataframe(self.dummy_dataframe, name="foo")
+            cli.write_points({"foo":dataframe})
 
     @raises(TypeError)
     def test_write_points_from_dataframe_fails_with_anything_but_dataframe(self):
         now = datetime(2014, 11, 16)
-        self.dummy_dataframe = pd.Series(data=[1.0, 2.0], index=[now, now+timedelta(hours=1)])
+        dataframe = pd.Series(data=[1.0, 2.0], index=[now, now+timedelta(hours=1)])
 
         with requests_mock.Mocker() as m:
             m.register_uri(requests_mock.POST, "http://localhost:8086/db/db/series")
 
             cli = InfluxDBClient(database='db')
-            cli.write_points_from_dataframe(self.dummy_dataframe, name="foo")
+            cli.write_points({"foo":dataframe})
 
     def test_query_into_dataframe(self):
         data = [