jumpserver/apps/common/parsers/csv.py

# ~*~ coding: utf-8 ~*~
#

import json
import chardet
import codecs
import unicodecsv

from rest_framework.parsers import BaseParser
from rest_framework.exceptions import ParseError

from ..utils import get_logger

logger = get_logger(__file__)


class JMSCSVParser(BaseParser):
    """
    Parses CSV file to serializer data
    """

    media_type = 'text/csv'

    @staticmethod
    def _universal_newlines(stream):
        """
        保证在`通用换行模式`下打开文件
        """
        for line in stream.splitlines():
            yield line

    @staticmethod
    def _gen_rows(csv_data, charset='utf-8', **kwargs):
        csv_reader = unicodecsv.reader(csv_data, encoding=charset, **kwargs)
        for row in csv_reader:
            if not any(row):  # 空行
                continue
            yield row

    @staticmethod
    def _get_fields_map(serializer):
        fields_map = {}
        fields = serializer.get_fields()
        fields_map.update({v.label: k for k, v in fields.items()})
        fields_map.update({k: k for k, _ in fields.items()})
        return fields_map

    @staticmethod
    def _process_row(row):
        """
        构建json数据前的行处理
        """
        _row = []
        for col in row:
            # 列表转换
            if isinstance(col, str) and col.find("[") != -1 and col.find("]") != -1:
                # 替换中文格式引号
                col = col.replace("“", '"').replace("”", '"').\
                    replace("‘", '"').replace('’', '"').replace("'", '"')
                col = json.loads(col)
            _row.append(col)
        return _row

    @staticmethod
    def _process_row_data(row_data):
        """
        构建json数据后的行数据处理
        """
        _row_data = {}
        for k, v in row_data.items():
            if isinstance(v, list) \
                    or isinstance(v, str) and k.strip() and v.strip():
                _row_data[k] = v
        return _row_data

    def parse(self, stream, media_type=None, parser_context=None):
        parser_context = parser_context or {}
        try:
            serializer = parser_context["view"].get_serializer()
        except Exception as e:
            logger.debug(e, exc_info=True)
            raise ParseError('The resource does not support imports!')

        try:
            stream_data = stream.read()
            stream_data = stream_data.strip(codecs.BOM_UTF8)
            detect_result = chardet.detect(stream_data)
            encoding = detect_result.get("encoding", "utf-8")
            binary = self._universal_newlines(stream_data)
            rows = self._gen_rows(binary, charset=encoding)

            header = next(rows)
            fields_map = self._get_fields_map(serializer)
            header = [fields_map.get(name, '') for name in header]

            data = []
            for row in rows:
                row = self._process_row(row)
                row_data = dict(zip(header, row))
                row_data = self._process_row_data(row_data)
                data.append(row_data)
            return data
        except Exception as e:
            logger.error(e, exc_info=True)
            raise ParseError('CSV parse error!')
-												Dev csv (#2640)

* [Update] 封装JMSCSVRender和JMSCSVParser

* [Update] 更改JMSCSVRender，根据请求参数控制导出csv的字段和下载csv模板的字段

* [Update] 导入空数据，提示错误消息

* [Update] 修改用户导入和导出功能代码

* [Update] 修改导入路由为动态反向解析

* [Update] 修改JMSCSVRender和JMSCSVParser以及用户导入导出代码

* [Update] 优化parsers逻辑

* [Update] 优化parsers csv代码结构

* [Update] 优化renders csv代码逻辑

* [Update] 删除parsers csv多余代码

* [Update] 删除parsers csv多余变量

* [Update] 优化renders csv代码结构

* [Update] 优化renders csv代码结构2

* [Update] 优化renders csv获取header逻辑

* [Update] 优化Cache Resources ID View逻辑

* [Update] 优化ViewSet IDCacheFilterMixin逻辑

* [Update] csv: parser render 添加异常捕获逻辑

* [Update] 删除多余代码

* [Update] 优化前端代码

* [Update] 修改小问题

* [Update] 修改前端导出用户的问题

* [Update] 前端 - 优化数据导出逻辑 APIExportData

* [Update] 修复批量创建用户时发送created信号的bug

* [Update] 优化导入时错误信息展示

* [Update] 优化parser、render时，对于多对多字段的处理

* [Update] 修改前端上传空文件问题

* [Update] 添加IDExportFilter，控制下载模版时的queryset

* [Update] 修改判断导出模版时参数变量名 action => template

* [Update] 修复导入用户数据时，用户组不生效的bug

* [Update] 修改前端导入信息展示

* [Update] 抽象资源导入模版

* [Update] 优化资源导入模版

* [Update] 修改js设置url的params逻辑

* [Update] 修改users序列类控制read_only字段方式

* [Update] 资产列表采用新的导入/导出csv文件逻辑

* [Update] 修改导入资产时设置资产所在节点逻辑

* [Update] 添加用户组导入/导出功能

* [Update] 修改前端变量名

* [Update] 修改下载导入模版，不包含org字段

* [Update] 增加管理用户导入/导出功能

* [Update] 导入模版提供id字段(为了资源备份后导入直接使用); 修复资源导入时联合唯一字段不校验导致创建时报错的bug

* [Update] 增加系统用户导入/导出功能

* [Update] 排序资源导入/导出字段

* [Update] 翻译导入/导出的字段和模版

* [Update] 更改csv导出和导出模版数据的控制在render实现

* [Update] 资产添加 更新导入 功能

* [Update] 用户/用户组/管理用户/系统用户/ 添加导入更新

* [Update] 翻译

* [Update] 优化资源序列化中的label

* [Update] 去掉资源IDInFilterMixin过滤

* [Update] 翻译

											
										
										
											2019-05-21 08:24:01 +00:00
+								# ~*~ coding: utf-8 ~*~
 								#
 								import json
-												[Update] 导入解析csv coding

											
										
										
											2019-05-31 09:40:57 +00:00
+								import chardet
-												[Update] 解决csv导入导出的问题

											
										
										
											2019-05-31 10:20:24 +00:00
+								import codecs
-												Dev csv (#2640)

* [Update] 封装JMSCSVRender和JMSCSVParser

* [Update] 更改JMSCSVRender，根据请求参数控制导出csv的字段和下载csv模板的字段

* [Update] 导入空数据，提示错误消息

* [Update] 修改用户导入和导出功能代码

* [Update] 修改导入路由为动态反向解析

* [Update] 修改JMSCSVRender和JMSCSVParser以及用户导入导出代码

* [Update] 优化parsers逻辑

* [Update] 优化parsers csv代码结构

* [Update] 优化renders csv代码逻辑

* [Update] 删除parsers csv多余代码

* [Update] 删除parsers csv多余变量

* [Update] 优化renders csv代码结构

* [Update] 优化renders csv代码结构2

* [Update] 优化renders csv获取header逻辑

* [Update] 优化Cache Resources ID View逻辑

* [Update] 优化ViewSet IDCacheFilterMixin逻辑

* [Update] csv: parser render 添加异常捕获逻辑

* [Update] 删除多余代码

* [Update] 优化前端代码

* [Update] 修改小问题

* [Update] 修改前端导出用户的问题

* [Update] 前端 - 优化数据导出逻辑 APIExportData

* [Update] 修复批量创建用户时发送created信号的bug

* [Update] 优化导入时错误信息展示

* [Update] 优化parser、render时，对于多对多字段的处理

* [Update] 修改前端上传空文件问题

* [Update] 添加IDExportFilter，控制下载模版时的queryset

* [Update] 修改判断导出模版时参数变量名 action => template

* [Update] 修复导入用户数据时，用户组不生效的bug

* [Update] 修改前端导入信息展示

* [Update] 抽象资源导入模版

* [Update] 优化资源导入模版

* [Update] 修改js设置url的params逻辑

* [Update] 修改users序列类控制read_only字段方式

* [Update] 资产列表采用新的导入/导出csv文件逻辑

* [Update] 修改导入资产时设置资产所在节点逻辑

* [Update] 添加用户组导入/导出功能

* [Update] 修改前端变量名

* [Update] 修改下载导入模版，不包含org字段

* [Update] 增加管理用户导入/导出功能

* [Update] 导入模版提供id字段(为了资源备份后导入直接使用); 修复资源导入时联合唯一字段不校验导致创建时报错的bug

* [Update] 增加系统用户导入/导出功能

* [Update] 排序资源导入/导出字段

* [Update] 翻译导入/导出的字段和模版

* [Update] 更改csv导出和导出模版数据的控制在render实现

* [Update] 资产添加 更新导入 功能

* [Update] 用户/用户组/管理用户/系统用户/ 添加导入更新

* [Update] 翻译

* [Update] 优化资源序列化中的label

* [Update] 去掉资源IDInFilterMixin过滤

* [Update] 翻译

											
										
										
											2019-05-21 08:24:01 +00:00
+								import unicodecsv
 								from rest_framework.parsers import BaseParser
 								from rest_framework.exceptions import ParseError
 								from ..utils import get_logger
 								logger = get_logger(__file__)
 								class JMSCSVParser(BaseParser):
 								    """
 								    Parses CSV file to serializer data
 								    """
 								    media_type = 'text/csv'
 								    @staticmethod
 								    def _universal_newlines(stream):
 								        """
 								        保证在`通用换行模式`下打开文件
 								        """
 								        for line in stream.splitlines():
 								            yield line
 								    @staticmethod
 								    def _gen_rows(csv_data, charset='utf-8', **kwargs):
 								        csv_reader = unicodecsv.reader(csv_data, encoding=charset, **kwargs)
 								        for row in csv_reader:
 								            if not any(row):  # 空行
 								                continue
 								            yield row
 								    @staticmethod
 								    def _get_fields_map(serializer):
 								        fields_map = {}
 								        fields = serializer.get_fields()
 								        fields_map.update({v.label: k for k, v in fields.items()})
 								        fields_map.update({k: k for k, _ in fields.items()})
 								        return fields_map
 								    @staticmethod
 								    def _process_row(row):
 								        """
 								        构建json数据前的行处理
 								        """
 								        _row = []
 								        for col in row:
 								            # 列表转换
 								            if isinstance(col, str) and col.find("[") != -1 and col.find("]") != -1:
 								                # 替换中文格式引号
 								                col = col.replace("“", '"').replace("”", '"').\
 								                    replace("‘", '"').replace('’', '"').replace("'", '"')
 								                col = json.loads(col)
 								            _row.append(col)
 								        return _row
 								    @staticmethod
 								    def _process_row_data(row_data):
 								        """
 								        构建json数据后的行数据处理
 								        """
 								        _row_data = {}
 								        for k, v in row_data.items():
 								            if isinstance(v, list) \
 								                    or isinstance(v, str) and k.strip() and v.strip():
 								                _row_data[k] = v
 								        return _row_data
 								    def parse(self, stream, media_type=None, parser_context=None):
 								        parser_context = parser_context or {}
 								        try:
 								            serializer = parser_context["view"].get_serializer()
 								        except Exception as e:
 								            logger.debug(e, exc_info=True)
 								            raise ParseError('The resource does not support imports!')
 								        try:
 								            stream_data = stream.read()
-												[Update] 解决csv导入导出的问题

											
										
										
											2019-05-31 10:20:24 +00:00
+								            stream_data = stream_data.strip(codecs.BOM_UTF8)
-												[Update] 导入解析csv coding

											
										
										
											2019-05-31 09:40:57 +00:00
+								            detect_result = chardet.detect(stream_data)
 								            encoding = detect_result.get("encoding", "utf-8")
-												Dev csv (#2640)

* [Update] 封装JMSCSVRender和JMSCSVParser

* [Update] 更改JMSCSVRender，根据请求参数控制导出csv的字段和下载csv模板的字段

* [Update] 导入空数据，提示错误消息

* [Update] 修改用户导入和导出功能代码

* [Update] 修改导入路由为动态反向解析

* [Update] 修改JMSCSVRender和JMSCSVParser以及用户导入导出代码

* [Update] 优化parsers逻辑

* [Update] 优化parsers csv代码结构

* [Update] 优化renders csv代码逻辑

* [Update] 删除parsers csv多余代码

* [Update] 删除parsers csv多余变量

* [Update] 优化renders csv代码结构

* [Update] 优化renders csv代码结构2

* [Update] 优化renders csv获取header逻辑

* [Update] 优化Cache Resources ID View逻辑

* [Update] 优化ViewSet IDCacheFilterMixin逻辑

* [Update] csv: parser render 添加异常捕获逻辑

* [Update] 删除多余代码

* [Update] 优化前端代码

* [Update] 修改小问题

* [Update] 修改前端导出用户的问题

* [Update] 前端 - 优化数据导出逻辑 APIExportData

* [Update] 修复批量创建用户时发送created信号的bug

* [Update] 优化导入时错误信息展示

* [Update] 优化parser、render时，对于多对多字段的处理

* [Update] 修改前端上传空文件问题

* [Update] 添加IDExportFilter，控制下载模版时的queryset

* [Update] 修改判断导出模版时参数变量名 action => template

* [Update] 修复导入用户数据时，用户组不生效的bug

* [Update] 修改前端导入信息展示

* [Update] 抽象资源导入模版

* [Update] 优化资源导入模版

* [Update] 修改js设置url的params逻辑

* [Update] 修改users序列类控制read_only字段方式

* [Update] 资产列表采用新的导入/导出csv文件逻辑

* [Update] 修改导入资产时设置资产所在节点逻辑

* [Update] 添加用户组导入/导出功能

* [Update] 修改前端变量名

* [Update] 修改下载导入模版，不包含org字段

* [Update] 增加管理用户导入/导出功能

* [Update] 导入模版提供id字段(为了资源备份后导入直接使用); 修复资源导入时联合唯一字段不校验导致创建时报错的bug

* [Update] 增加系统用户导入/导出功能

* [Update] 排序资源导入/导出字段

* [Update] 翻译导入/导出的字段和模版

* [Update] 更改csv导出和导出模版数据的控制在render实现

* [Update] 资产添加 更新导入 功能

* [Update] 用户/用户组/管理用户/系统用户/ 添加导入更新

* [Update] 翻译

* [Update] 优化资源序列化中的label

* [Update] 去掉资源IDInFilterMixin过滤

* [Update] 翻译

											
										
										
											2019-05-21 08:24:01 +00:00
+								            binary = self._universal_newlines(stream_data)
 								            rows = self._gen_rows(binary, charset=encoding)
 								            header = next(rows)
 								            fields_map = self._get_fields_map(serializer)
 								            header = [fields_map.get(name, '') for name in header]
 								            data = []
 								            for row in rows:
 								                row = self._process_row(row)
 								                row_data = dict(zip(header, row))
 								                row_data = self._process_row_data(row_data)
 								                data.append(row_data)
 								            return data
 								        except Exception as e:
-												[Update] 导入解析csv coding

											
										
										
											2019-05-31 09:40:57 +00:00
+								            logger.error(e, exc_info=True)
-												Dev csv (#2640)

* [Update] 封装JMSCSVRender和JMSCSVParser

* [Update] 更改JMSCSVRender，根据请求参数控制导出csv的字段和下载csv模板的字段

* [Update] 导入空数据，提示错误消息

* [Update] 修改用户导入和导出功能代码

* [Update] 修改导入路由为动态反向解析

* [Update] 修改JMSCSVRender和JMSCSVParser以及用户导入导出代码

* [Update] 优化parsers逻辑

* [Update] 优化parsers csv代码结构

* [Update] 优化renders csv代码逻辑

* [Update] 删除parsers csv多余代码

* [Update] 删除parsers csv多余变量

* [Update] 优化renders csv代码结构

* [Update] 优化renders csv代码结构2

* [Update] 优化renders csv获取header逻辑

* [Update] 优化Cache Resources ID View逻辑

* [Update] 优化ViewSet IDCacheFilterMixin逻辑

* [Update] csv: parser render 添加异常捕获逻辑

* [Update] 删除多余代码

* [Update] 优化前端代码

* [Update] 修改小问题

* [Update] 修改前端导出用户的问题

* [Update] 前端 - 优化数据导出逻辑 APIExportData

* [Update] 修复批量创建用户时发送created信号的bug

* [Update] 优化导入时错误信息展示

* [Update] 优化parser、render时，对于多对多字段的处理

* [Update] 修改前端上传空文件问题

* [Update] 添加IDExportFilter，控制下载模版时的queryset

* [Update] 修改判断导出模版时参数变量名 action => template

* [Update] 修复导入用户数据时，用户组不生效的bug

* [Update] 修改前端导入信息展示

* [Update] 抽象资源导入模版

* [Update] 优化资源导入模版

* [Update] 修改js设置url的params逻辑

* [Update] 修改users序列类控制read_only字段方式

* [Update] 资产列表采用新的导入/导出csv文件逻辑

* [Update] 修改导入资产时设置资产所在节点逻辑

* [Update] 添加用户组导入/导出功能

* [Update] 修改前端变量名

* [Update] 修改下载导入模版，不包含org字段

* [Update] 增加管理用户导入/导出功能

* [Update] 导入模版提供id字段(为了资源备份后导入直接使用); 修复资源导入时联合唯一字段不校验导致创建时报错的bug

* [Update] 增加系统用户导入/导出功能

* [Update] 排序资源导入/导出字段

* [Update] 翻译导入/导出的字段和模版

* [Update] 更改csv导出和导出模版数据的控制在render实现

* [Update] 资产添加 更新导入 功能

* [Update] 用户/用户组/管理用户/系统用户/ 添加导入更新

* [Update] 翻译

* [Update] 优化资源序列化中的label

* [Update] 去掉资源IDInFilterMixin过滤

* [Update] 翻译

											
										
										
											2019-05-21 08:24:01 +00:00
+								            raise ParseError('CSV parse error!')