hortonworks参数详解
- 格式:xlsx
- 大小:11.13 KB
- 文档页数:3
Hadoop中常用端口说明和相关配置文件Hadoop是一个开源的分布式处理系统,可以对大规模数据进行高效的存储和处理。
在Hadoop中,有许多常用的端口和相关配置文件,这些端口和文件对于Hadoop集群的运行非常重要。
本文将详细介绍Hadoop中常用的端口说明和相关配置文件。
一、Hadoop常用端口说明1. Namenode端口:默认端口为8020,是Hadoop集群中的主节点,存储有HDFS的元数据信息,命令行中通过hdfs://<namenode-ip>:8020/访问HDFS。
Namenode的端口负责管理整个集群中文件块的元数据信息,由于这些信息比较重要,建议使用安全的方式进行访问和管理。
2. Datanode端口:默认端口为50010,是Hadoop集群中的从节点,存储有HDFS的数据块。
Datanode的端口用于管理数据块,当文件需要进行读写操作时,客户端会向Namenode请求相应数据块的位置信息,然后直接通过Datanode端口进行读写操作。
3. Secondary Namenode端口:默认端口为50090,是Hadoop集群中的辅助节点,不存储实际数据,但能够定期备份主节点的元数据信息,避免因Namenode节点失效而导致Hadoop集群无法访问。
4. JobTracker端口:默认端口为8021,是Hadoop中的工作节点,负责处理MapReduce任务。
JobTracker的端口负责监控整个Hadoop集群中的运行情况,以及处理MapReduce任务的分配和管理。
5. TaskTracker端口:默认端口为50060,是Hadoop中的工作节点,负责处理MapReduce任务。
TaskTracker的端口负责处理实际的MapReduce任务,将计算结果返回给JobTracker进行处理。
二、Hadoop相关配置文件1. core-site.xml:这个配置文件是Hadoop的核心配置文件之一,主要用于配置Hadoop集群的全局属性。
distcp参数Distcp是Hadoop中的一个工具,用于在不同的Hadoop集群之间复制数据。
它可以在不同的集群之间复制大量的数据,而不会影响到正在运行的作业。
Distcp的参数可以帮助我们更好地控制数据复制的过程。
Distcp的参数包括以下几个方面:1. 基本参数-src:指定源路径,可以是HDFS路径或本地文件系统路径。
-target:指定目标路径,可以是HDFS路径或本地文件系统路径。
2. 复制控制参数-overwrite:如果目标路径已经存在,则覆盖目标路径中的文件。
-update:只复制源路径中比目标路径中更新的文件。
-ignore-errors:忽略复制过程中的错误,继续复制其他文件。
-skipcrccheck:跳过CRC校验,加快复制速度。
3. 带宽控制参数-bandwidth:指定复制带宽,单位是MB/s。
-m:指定最大并发复制任务数。
4. 日志控制参数-verbose:显示详细的复制过程信息。
-log:指定日志文件路径。
5. 安全控制参数-preserve-block-size:保留源文件的块大小。
-preserve-replication:保留源文件的副本数。
-preserve-raw-xattrs:保留源文件的扩展属性。
-distcp-ssl.conf:指定SSL配置文件路径。
以上是Distcp的常用参数,通过这些参数,我们可以更好地控制数据复制的过程,提高复制效率和安全性。
总结:Distcp是Hadoop中的一个工具,用于在不同的Hadoop集群之间复制数据。
它可以在不同的集群之间复制大量的数据,而不会影响到正在运行的作业。
Distcp的参数可以帮助我们更好地控制数据复制的过程,包括基本参数、复制控制参数、带宽控制参数、日志控制参数和安全控制参数。
通过这些参数,我们可以更好地控制数据复制的过程,提高复制效率和安全性。
文章标题:深度解析hive -hiveconf参数的使用与影响摘要:本文将深入探讨Hive中的-hiveconf参数的使用与影响,从基础概念、具体用法到个人观点和理解,全面介绍其在数据处理和分析中的重要性和优势。
正文:1. 介绍-hiveconf参数在Hive中,-hiveconf参数是用来指定Hive配置参数的一种方式。
它可以在启动Hive会话或运行Hive脚本时,注入配置参数,以覆盖Hive默认的配置值。
通过-hiveconf参数,用户可以在不修改Hive全局配置的情况下,改变某些配置参数的值,从而实现对Hive行为的精细控制。
2. -hiveconf参数的具体用法在实际应用中,-hiveconf参数可以通过以下方式来使用:```$ hive -hiveconf mapred.reduce.tasks=10```通过上述命令,用户可以在启动Hive会话时,将mapred.reduce.tasks参数的值设置为10,以控制Hive作业的reduce任务数量。
除了在启动Hive会话时使用,-hiveconf参数还可以在Hive脚本中使用,例如:```SET mapred.reduce.tasks=10;```通过在Hive脚本中使用SET命令,用户可以在脚本内部动态地改变Hive配置参数的值,从而实现更灵活的数据处理和分析。
3. -hiveconf参数的影响与优势-hiveconf参数的使用对Hive作业的执行和性能有着重要的影响。
通过灵活配置Hive参数,用户可以根据实际情况调整Hive作业的行为,从而提高作业的执行效率和资源利用率。
通过调整mapred.reduce.tasks参数,用户可以更好地控制Hive作业的reduce任务数量,避免不必要的资源浪费或性能瓶颈。
4. 个人观点与理解作为一个资深的Hive用户,我个人认为-hiveconf参数是Hive中一个非常重要的功能,它为用户提供了灵活地控制Hive行为的能力。
datax hdfswriter参数标题:DataX HDFSWriter参数详解引言:DataX是一个开源的数据同步工具,用于大数据领域的数据交互和同步。
其中,HDFSWriter是DataX中用于将数据写入HDFS(Hadoop分布式文件系统)的插件。
本文将详细介绍DataX HDFSWriter的参数,帮助读者更好地理解和使用该插件。
正文内容:一、HDFSWriter参数概述1.1 文件系统类型(fileType)1.2 文件路径(path)1.3 文件命名规则(fileName)1.4 文件压缩格式(compress)1.5 文件写入模式(writeMode)二、文件系统类型(fileType)2.1 HDFS文件系统类型(hdfs)2.2 本地文件系统类型(local)三、文件路径(path)3.1 HDFS文件路径(hdfsPath)3.2 本地文件路径(localPath)四、文件命名规则(fileName)4.1 文件名前缀(namePrefix)4.2 文件名后缀(nameSuffix)五、文件压缩格式(compress)5.1 不压缩(none)5.2 Gzip压缩(gzip)5.3 Bzip2压缩(bzip2)5.4 Snappy压缩(snappy)六、文件写入模式(writeMode)6.1 覆盖模式(truncate)6.2 追加模式(append)总结:DataX HDFSWriter参数的详细介绍如上所述。
通过了解这些参数,用户可以根据自身需求进行配置,实现数据写入HDFS的个性化操作。
在实际使用中,应根据具体场景选择合适的参数值,以获得最佳的性能和效果。
(注:本文以DataX版本为基准进行介绍,不同版本的DataX可能存在参数差异,请以实际情况为准。
)以上是一篇关于DataX HDFSWriter参数的详细介绍,希望对您有所帮助。
如有任何疑问或需要进一步了解,请随时与我们联系。
gwo控制参数GWO(Grey Wolf Optimizer)是一种模拟灰狼群体行为的优化算法,它通过模拟灰狼的社会行为来解决复杂的优化问题。
在GWO算法中,存在一些重要的控制参数,这些参数会直接影响算法的性能和收敛速度。
本文将介绍GWO算法中的几个重要控制参数,并讨论它们的作用以及如何选择合适的参数值。
1. 灰狼群体数量(N)灰狼群体数量是指参与算法优化的灰狼个体数量。
较大的群体数量可以增加搜索空间的覆盖度,提高算法的全局搜索能力。
然而,过大的群体数量会增加计算复杂度,降低算法的收敛速度。
因此,在选择灰狼群体数量时,需要综合考虑问题的复杂度和计算资源的限制。
2. 迭代次数(Max_iter)迭代次数是指算法执行的总次数。
较大的迭代次数可以增加算法的搜索深度,提高优化效果。
然而,过大的迭代次数会增加计算时间,降低算法的执行效率。
因此,在选择迭代次数时,需要根据问题的复杂度和时间资源的限制进行权衡。
3. 狼群的迁徙速度(a)狼群的迁徙速度参数控制了狼群在搜索空间中的移动速度。
较大的迁徙速度可以增加算法的全局搜索能力,但可能会导致算法陷入局部最优解。
较小的迁徙速度可以提高算法的局部搜索能力,但可能会导致算法收敛速度较慢。
因此,在选择狼群的迁徙速度时,需要根据问题的性质和优化目标进行调整。
4. 狼群的迁徙距离(A)狼群的迁徙距离参数控制了狼群在搜索空间中的移动范围。
较大的迁徙距离可以增加算法的搜索范围,提高全局搜索能力。
然而,过大的迁徙距离可能会导致算法的震荡和不稳定。
较小的迁徙距离可以提高算法的局部搜索能力,但可能会导致算法陷入局部最优解。
因此,在选择狼群的迁徙距离时,需要综合考虑问题的复杂度和优化目标。
5. 狼的位置更新系数(C)狼的位置更新系数参数控制了狼的位置更新的幅度。
较大的位置更新系数可以增加算法的搜索速度,但可能会导致算法在搜索空间中跳跃过大。
较小的位置更新系数可以增加算法的稳定性,但可能会导致算法的收敛速度较慢。
hbase参数HBase 是一个分布式、面向列的开源数据库系统,建立在Apache Hadoop 上。
HBase 的性能和行为可以通过配置多个参数进行调整。
以下是一些常见的HBase 配置参数及其简要说明:1. .port:-描述: Master 的信息端口。
-默认值: 16010。
2. hbase.regionserver.global.memstore.upperLimit:-描述: RegionServer 上所有MemStore 的全局内存使用上限。
-默认值: 0.4。
3. hbase.hregion.memstore.flush.size:-描述: 单个Region 的MemStore 刷新阈值。
-默认值: 134217728(128MB)。
4. hbase.hregion.max.filesize:-描述: 单个HFile 的最大大小。
-默认值: 10737418240(10GB)。
5. hbase.hstore.flusher.count:-描述: 每个RegionServer 上的MemStore Flush 线程数量。
-默认值: 1。
6. paction.max.size:-描述: 每次compaction 的最大数据大小。
-默认值: 9223372036854775807(Long.MAX_VALUE)。
7. hbase.hregion.majorcompaction:-描述: Region 是否允许执行major compaction。
-默认值: true。
8. hbase.client.scanner.timeout.period:-描述: 客户端扫描操作的超时时间。
-默认值: 60000 毫秒(1 分钟)。
9. hbase.client.retries.number:-描述: 客户端操作的重试次数。
-默认值: 35。
10. hbase.rpc.timeout:-描述: RPC 请求的超时时间。
HPUX 核心参数详解配置:操作系统-HP-UX 11.01、Accounting Subsystem(记帐子系统)acctsuspend 暂停记帐Minimum: -100Maximum: 100Default: 2acctresume 恢复记帐Minimum: -100Maximum: 101Default: 42、Asynchronous I/O Subsystem(异步I/O子系统)aio_listio_max 可以在一个lio_list()调用中指定的AIO操作的最大数Minimum: 2Maximum: 0x10000Default: 256aio_max_ops 在任意时间被查询的AIO操作的最大数Minimum: 1Maximum: 0x100000Default: 2048aio_physmem_pct 在系统中能够锁定用于POSIX异步I/O操作的总物理存的最大百分比Minimum: 5Maximum: 50Default: 10aio_prio_delta_max 最大减速因子,在aiocb的aio_reqprio域的最大优先权减少Minimum: 0Maximum: 20Default: 203、Dump Parameters(转储参数)alwaysdump 包含在转储中的核心存页面位掩码Minimum: 0Maximum: noneDefault: 0dontdump 不在转储中的核心存页面位掩码Maximum: noneDefault: 0initmodmax 由系统崩溃转储保存的核心模块的最大数Minimum: 0Maximum: noneDefault: 50modstrmax 核心模块savecrash表的最大长度Minimum: 500Maximum: noneDefault: 5004、Fiber Channel Subsystem(光纤通道子系统)num_tachyon_adapters Tachyon适配器的数目Minimum: 0Maximum: 5Default: 0max_fcp_reqs 所允许的最大并发FCP请求数Minimum: 0Maximum: 1024Default: 5125、Mass-Storage Subsystem(海量存储子系统)* Configurable File System Buffer-Cache Parameters(可配置的文件系统高速缓冲参数): bufpages 静态高速缓冲页面数Minimum: 0 or 6 (nbuf*2 or 64 pages)Maximum: 限制的存Default: 0dbc_min_pct 最小动态高速缓冲Minimum: 2Maximum: 90Default: 5dbc_max_pct 最大动态高速缓冲Minimum: 2Maximum: 90Default: 50nbuf 静态缓冲头部数Minimum: 0 or 16Maximum: 限制的存Default: 0* Configurable Open or Locked Files Parameters(可配置的打开或加锁文件参数): maxfiles 对打开文件的软限制Minimum: 30Maximum: 60000maxfiles_lim 对打开文件的硬限制Minimum: 30Maximum: 60000Default: 1024nfile 全系统打开文件限制Minimum: 14Maximum: 限制的存Default: ((16*(nproc+16+maxusers)/10)+32+2*(npty+nstrp ty))nflocks 全系统文件锁限制Minimum: 2Maximum: 限制的存Default: 200ninode 存中打开节点的最大数Minimum: 14Maximum: 限制的存Default: nproc+48+maxusers+(2*npty)* Configurable Asynchronous Write Parameter(可配置的异步写入参数):fs_async 启动/关闭异步磁盘写Minimum: 0(只使用同步磁盘写)Maximum: 1(允许异步磁盘写)Default: 0* Configurable VxFS (Journaled) File-System Parameter(可配置的VxFS文件系统参数): vx_ncsize 为VxFS目录的路径名高速缓冲所保留的存空间(以字节为单位)Minimum: 0Maximum: NoneDefault: 1024* Filesystem Performance Parameters(文件系统性能参数):hfs_ra_per_disk 设置文件系统的预读量(以K字节为单位)Minimum: -Maximum: -Default: 64hfs_max_ra_blocks (对一个单一的HFS文件系统,核心允许有的未完成的预读块的最大数的上限(以文件系统块为单位))Minimum: -Maximum: -Default: 8vxfs_ra_per_disk 设置文件系统预读量(以K字节为单位)Minimum: -Maximum: -最大预读数是下面两个数中较小的一个:vxfs_ra_per_disk * (逻辑卷中的磁盘数)或vxfs_max_ra_kbytesDefault: 1024vxfs_max_ra_kbytes 一个VXFS文件系统可以有的未完成的预读总数的上限(以K字节为单位))Minimum: -Maximum: -参见vxfs_ra_per_diskDefault: 10246、Logical Volume Manager (LVM) Subsystem(逻辑卷组管理器(LVM)子系统)maxvgs 系统中的最大卷组数Minimum: 1Maximum: 256Default: 10no_lvm_disks 系统中无卷组(只用于700系列))Minimum: 0(检查LVM磁盘)Maximum: 1 (系统没有LVM磁盘)Default: 07、Memory Swap Subsystem(存交换子系统)* Memory paging parameters(存页面参数):allocate_fs_swapmap 固定的或动态的交换数据结构分配Minimum: 0(根据需要分配交换数据结构)Maximum: 1(预先分配必须的核心数据结构)Default: 0maxswapchunks 对客户来说,可得到的最大交换空间Minimum: 1Maximum: 16384Default: 256nswapdev 可得到的交换设备的数量Minimum: 1Maximum: 25Default: 10nswapfs 系统用于交换的文件数Minimum: 1Maximum: 25Default: 10page_text_to_local 在客户端启动/关闭文本交换Minimum: 0(独立方式或客户方式使用文件系统服务器)Maximum: 1 (使用客户本地交换)Default: 1(使用客户本地交换)remote_nfs_swap 启动/关闭对远程NFS的交换Maximum: 1Default: 0swapmem_on 启动/关闭虚交换保留Minimum: 0(关闭虚交换保留)Maximum: 1(启动虚交换保留)Default: 1swchunk 客户交换块大小Minimum: 2048Maximum: 16384Default: 2048* Variable-Page-Size参数:vps_ceiling 以K字节为单位,最大的系统选择的页面大小Minimum: 4Maximum: 65536Default: 16vps_chatr_ceiling 以K字节为单位,最大的chatr选择的页面大小Minimum: 4 KbytesMaximum: 65536 KbytesDefault: 65536 Kbytesvps_pagesize 以K字节为单位,缺省用户页面大小Minimum: 4Maximum: 65536Default: 48、Process Management Subsystem(进程管理子系统)maxdsiz 最大进程数据段大小(32位)Minimum: 0x400000 (4 Mbytes)Maximum: 0x7B03A000 (大约 2 Gbytes)Default: 0x4000000 (64 Mbytes)maxdsiz_64bit 最大进程数据段大小(64位)Minimum: 0x400000 (4 Mbytes)Maximum: 79Default: 0x4000000 (64 Mbytes)maxssiz 最大进程存储段大小(32位)Minimum: 0x4000 (16 Kbytes)Maximum: 0x17F00000 (approx 200 Mbytes)Default: 0x800000 (8 Mbytes)maxssiz_64bit 最大进程存储段大小(32位)Minimum: 0x4000 (16 Kbytes)Maximum: 1073741824Default: 0x800000 (8 Mbytes)max_thread_proc 一个进程所能创建的线程的最大数Minimum: 64Default: 64maxtsiz 最大进程文本段大小(32位)Minimum: 0x40000 (4 Mbytes)Maximum: 0x7B033000 (大约 2 Gbytes)Default: 0x4000000 (64 Mbytes)maxtsiz_64bit 最大进程文本段大小(64位)Minimum: 0x40000 (4 Mbytes)Maximum: 03 (大约 4 Gbytes)Default: 0x4000000 (64 Mbytes)maxuprc 每个用户的最大进程数Minimum: 3Maximum: nproc-4Default: 50nkthread 在系统上同时允许的核心线程的最大数Minimum: 50Maximum: 30000Default: (nproc*2)+16nproc 全系统进程的最大数Minimum: 10Maximum: 限制的存Default: 20+(8 * maxusers)timeslice 在竞争进程间的时间片分配Minimum: -1Maximum: 2147483647 (大约8个月)Default: 10(10个10毫秒)9、Character-Mode I/O Streams Parameters(字符模式的I/O流参数)NSTRBLKSCHED 厂家使用。
DB2的参数配置说明1.数据库配置参数:-DFT_DEGREE:默认配置为1,表示数据库服务器可以并行处理的任务数量。
可以根据服务器硬件配置调整此参数,以提高并行处理能力。
-MAXAPPLS:默认配置为100,表示数据库支持的最大并发连接数。
如果数据库负载较高,可以适当增加此值。
-LOCKLIST:默认配置为200,表示数据库锁的最大数量。
如果数据库经常出现锁冲突,可以适当增加此值。
-SHEAPTHRES:默认配置为0,表示数据库共享内存区域的大小。
可以根据数据库工作负载的大小调整此值,以提高性能。
2.缓冲池参数配置:-PCKCACHESZ:控制预编译包缓冲池的大小,为了提高性能,可以根据实际需求调整此参数。
-HADR_SYNCMODE:用于配置DB2的高可用性和灾难恢复功能。
可以根据实际需求选择异步或同步模式。
-LOGFILSIZ:表示数据库日志文件的最大大小。
可以根据数据库运行情况和可用存储空间来调整此参数。
-UTIL_HEAP_SZ:用于配置数据库工具的堆大小。
可以根据数据库工具的需求来调整此值,以提高操作效率。
3.SQL优化参数配置:-STMTHEAP:用于配置SQL语句的堆大小。
可以根据SQL语句的复杂度和数据量来调整此参数,以提高查询性能。
-STMM:表示是否开启自动内存管理功能。
可以根据实际需求选择开启或关闭。
-OPT_MEMORY:表示查询优化器使用的内存大小。
可以根据查询复杂度和数据量来调整此值,以提高查询性能。
-DIAGLEVEL:用于配置记录诊断信息的级别。
可以根据需要调整此参数,进行问题排查和性能优化。
以上是一些常见的DB2参数配置说明,根据实际需求和数据库运行情况,可以调整这些参数来达到最佳的性能和可靠性。
需要注意的是,调整参数配置时应谨慎,并进行充分测试和验证,以避免潜在的风险和问题。
hadoopfs参数HadoopFS是指Hadoop分布式文件系统,是Apache Hadoop生态系统的核心组件之一。
HadoopFS作为一种分布式文件系统,其特点是具有高可靠性、高可扩展性和高性能等优点,可以存储海量数据和处理大规模数据分析。
下面是HadoopFS常用的参数:1. fs.defaultFS:指定默认的文件系统,可以是HadoopFS、HDFS、S3等。
2. dfs.replication:指定数据块的副本数,默认为3个。
3. dfs.blocksize:指定数据块的大小,默认为128MB。
4. node.handler.count:指定NameNode的线程数,用于处理客户端的请求。
5. io.file.buffer.size:指定文件读写的缓存大小,默认为4KB。
6. dfs.data.dir:指定数据块的存放目录。
7. dfs.permissions.superusergroup:指定超级用户组,默认为hadoop。
8. .dir:指定NameNode的元数据存放目录。
9. node.checkpoint.dir:指定NameNode的checkpoint存放目录。
10. mapreduce.jobtracker.address:指定JobTracker的地址。
11. :指定MapReduce框架的名称,可以是yarn、local等。
12. yarn.resourcemanager.address:指定资源管理器的地址。
13. yarn.app.mapreduce.am.resource.mb:指定MapReduce应用程序的资源大小。
14. mand-opts:指定MapReduce应用程序启动参数。
15. yarn.nodemanager.local-dirs:指定节点管理器的数据目录。
以上是HadoopFS常用的参数,可以根据实际需求进行调整和优化。
hbase configuration 参数说明HBase是一个分布式、可扩展的开源NoSQL数据库,用于存储和处理大规模结构化数据。
HBase的配置参数对于数据库的性能和可靠性至关重要。
以下是一些常见的HBase配置参数及其说明:1. hbase.cluster.distributed:- 默认值:true- 描述:指示HBase是否在分布式模式下运行。
设置为true表示HBase以分布式模式运行,设置为false表示以伪分布式模式运行。
2. hbase.rootdir:- 默认值:file:///tmp/hbase- 描述:指定HBase数据的根目录路径。
可以替换file://为hdfs://以指定HDFS上的路径。
3. hbase.zookeeper.quorum:- 默认值:localhost- 描述:指定用于HBase的ZooKeeper集群的主机名或IP地址。
多个主机名或IP地址之间使用逗号分隔。
4. hbase.zookeeper.property.clientPort:- 默认值:2181- 描述:指定用于HBase的ZooKeeper客户端连接的端口号。
5. hbase.regionserver.handler.count:- 默认值:30- 描述:指定每个RegionServer处理请求的线程数。
增加此值可以提高读写吞吐量,但同时也会增加系统资源的消耗。
6. hbase.hregion.max.filesize:- 默认值:10737418240(10GB)- 描述:指定每个HBase Region的最大存储文件大小。
如果一个文件大小超出此限制,将会被切分成多个文件。
7. hbase.client.scanner.caching:- 默认值:100- 描述:指定客户端扫描操作一次从服务器端获取的行数。
增加此值可以提高客户端扫描操作的性能,但同时也会增加网络传输的开销。
这些只是HBase配置参数的一小部分,还有许多其他参数可以根据特定需求进行配置。
组件名称参数名称
YARNResourceManager Java heap size
NodeManager Java heap size
yarn.nodemanager.resource.memory-mb
HbaseHBase Master Maximum Java heap size
RegionServers maximum Java heap size
hbase.regionserver.handler.count
hbase.hregion.majorcompaction
hbase.hregion.memstore.block.multiplier
hbase.hregion.memstore.flush.size
hbase.balancer.period
hfile.block.cache.size
hbase.regionserver.global.memstore.upperLimit
hbase.server.thread.wakefrequency
hbase.master.distributed.log.splitting
hbase.hstore.blockingStoreFiles
hbase.hregion.memstore.flush.size
hbase.hregion.memstore.mslab.enabled
hbase.client.keyvalue.maxsize
参数说明单位默认值最新值
resourceManager使用堆空间的大小MB10241024
所有节点的NodeManager最大使用堆空间大小MB20482048
可以分配给nodemanager的物理内存量MB40964096
Hmaster进程最大使用堆空间大小MB10241024
RegionServer进程最大使用堆空间大小MB20484096
RegionServer的请求处理IO线程数int10100
major、compaction的执行周期8640000086400000
当一个
region里的memstore占用内存大小超
过hbase.hregion.memstore.flush.size xx倍
的大小时,block该region的所有请求,进行
flush,释放内存;
容忍缓存中写入数据超过
hbase.hregion.memstore.flush.size缓冲区
最大的倍数;
每次写入时,判断超出缓存的倍数后,不能
再写入,阻塞,等待flush完成后,会进行GC
回收,regionserver会暂停
完成flush,并gc回收后,则继续接收数据;
这个过程中容易出现regionserver服务暂
停,与hmaster失败心跳超时,引起
regionserver下线。
int28
当一个region里的memstore占用内存大小超过byte134217728134217728
负载均衡以特定时间间隔执行ms3000001200000
HFile文件的块缓存大小占堆内存大小的比例%0.40.4
当ReigonServer内所有region的memstores所占用内存总和达到heap的xx%时,HBase会强制block所有的更新并flush%0.40.4
服务线程的sleep时间:默认是10s
每间隔
hbase.server.thread.wakefrequency时间
(默认10s)检查一次regionserver 缓冲
区大小,超过
hbase.hregion.memstore.flush.size此大
小则flush刷新到hdfs文件中;
若此参数间隔太久,且数据写入太多,会
引起长时间的阻塞等待flush;因此高并发
写入时,此参数要适当调小。ms10000100
分布式log splitting方式booleanTRUEFALSE
在flush时,当一个region中的Store(Coulmn Family)内有超过xx个storefile时,则block所有的写请求进行compaction
一个region下面的所有store里面的memstore的达到多少时,开始将这些memstore flush到hdfs中
启用hbase0.90x版本引入的一种高级机制来缓booleanFALSETRUE
列族的最大值byte10485760104857600
写请求进行compaction
dfs中去